見出し画像

#6 世界で大注目のDeepSeekについて調べてみた

こんにちは、Minoです。
「DeepSeek」って聞いたことありますか? 
私は先週、初めて知りました。
中国発のAI企業で、天下のOpen AI/Chat-GPTの対抗馬として頭角を現しているのです。それがなんと、25年1月27日時点で無料アプリのランキングで、Chat-GPTを抜いて1位になっていました!

今回は世界で注目を集めているAI「DeepSeek」について、自分自身の勉強に加え、「当時はこんなだったのか」と振り返る日が来るかもしれないので、テーマとして取り上げました。
この記事では、25年1月27日時点のDeepSeekの状況について、様々な角度から情報をまとめていきますので、今後の参考にしていただければ幸いです!


DeepSeekの創業者は?

DeepSeekは、中国を拠点とするAI企業で、大規模言語モデル(LLM)の開発を専門としています。創業者の趙永剛(Zhao Yonggang)氏は、ByteDanceでAI研究に従事していた経験を活かし、2023年にDeepSeekを設立しました。なんと、彼はOpen AI創業者のサム・アルトマンと同年代の今年40歳だそうです…。(二人ともすごい。。)

日経記事でも取り上げられていますが、アメリカでもアプリDLで1位をとったそうです。

何がそんなにすごいのか? 以下に続きます。

DeepSeekの「すごさ」とは?

近年、AI技術の進化が進む中で、中国発のAI企業「DeepSeek」が注目を集めている、その主な理由は、「低価格」「高精度」「商用利用可能」という三拍子揃っている点にあります。

1. 低価格

DeepSeekは、ChatGPTなどの競合モデルと比べても圧倒的に低価格です。特にトークンあたりのAPIの利用料金が格段に安く、企業や個人にとって導入しやすい点が評価されています。低コストながら高性能を実現している点が、話題となる大きな理由の一つです。

https://api-docs.deepseek.com/news/news250120


2. 高精度な性能

DeepSeekは、数学・プログラミング・質問応答・知識理解など、多方面においてトップレベルの精度を誇ります。DeepSeekの大規模言語モデル「DeepSeek-V3」は、GPT-o1やClaude 3.5 以上の性能を誇ります。


3. 商用利用が可能

DeepSeekは、MITライセンスのもとでモデルを公開しており、商用利用が可能です。これにより、企業が自社のシステムに組み込んだり、独自のAIアプリケーションを開発したりすることが容易になります。特に、蒸留モデル(注)を利用して他のAIをトレーニングできる点が大きなメリットです。今後はDeepseekが様々な業界特化型AIなどのグランドマザー的な大本基盤になっていくのかもしれませんね。

(注)蒸留モデル(Distilled Model)とは、機械学習やAI分野における知識蒸留(Knowledge Distillation)という技術を利用したモデルのことです。
知識蒸留とは、大規模で高性能なAIモデル(教師モデル)から、その知識を小型で軽量なAIモデル(生徒モデル)に継承する技術です。この方法により、計算コストを抑えつつ、元の大規模モデルに近い性能を持つモデルを作成できます。

Chat-GPT 4oにて生成

まとめ

以上の通り、新興AIツールのDeepSeekは「安い」「賢い」「商用利用可能」という現時点で世界最強の強みを持つAIツールのようです。
実際にログインしてみると、UIがChat-GPTと驚くほど似ているため、ユーザーとしても全く違和感なく使えます。(恐るべしDeepseek…)

Open AIはじめ、世界のAI競争がエネルギー戦争に向かっていこうとする中、このような革新的な技術が生まれたことで、大きなゲームチェンジが起こったのではないでしょうか。

Open AIとの一騎打ちとなるのか、果たして今後の行方は!
今後も目が離せませんね!
以上、世界で大注目のDeepSeekについて調べてみました @2025/01/27

#AI
#DeepSeek
#AI活用
#AI企業
#AI技術

いいなと思ったら応援しよう!