見出し画像

deepseekは生成AI開発のゲームチェンジャーになり得るか?

こんにちは、お金が入るでかねいりです。

今、世界経済を騒がせている企業があります。それがdeepseek(ディープシーク)という会社です。

そこで今日は、「なぜディープシークが世界経済を騒がせているのか?」、「何がすごいのか?」、「今後どのような影響がありそうなのか?」について考えたことをお伝えできればと思います。
※以下は日経新聞の記事をベースに作成をしております


■なぜ、ディープシークが世界経済を騒がせているのか?

ディープシークは、生成AIモデルを開発する中国の企業

2025年1月20日に最新の生成AIモデル「R1」を発表。この「R1」、アップルのアメリカのアプリストアでダウンロード数が首位に。その性能は、アメリカ製の競合モデルと同等、もしくはそれ以上と評価され、注目が集まっています。

では、ディープシークは、何がすごいんでしょうか?

~ディープシークの特徴~

【低コストで開発した大規模言語モデル(低コスト生成AI)】
ディープシークは、生成AIの基盤となる1つの大規模言語モデルの開発にかかった費用が約560万ドルで、開発期間は約2カ月だったと説明しています。また、生成AIの学習に最先端ではない画像処理半導体(GPU)を使ったと説明しています。

大規模言語モデルのコストを試算しているスタンフォード大によると、グーグルの一世代前のAI「ジェミニウルトラ」の開発には1億9100万ドル(約300億円)、オープンAIの「GPT-4」は7800万ドルがかかったとされていて、ディープシークの主張が事実であれば、単純計算で、アメリカテック企業の10分の1未満の費用で開発できたことになります。

アメリカテック企業による巨額投資の前提となってきた法則が崩れる恐れがあることから、大きなニュースになりました。

【高性能】
ディープシークが大きなニュースとなっている理由が、低コスト(安い)ということだけではないところにあります。それは性能が、アメリカの生成AIモデルと同等クラスで高性能であるという点です。

様々な分野の質問に多言語で答える能力があり、難易度の高い数学の問題を解く能力など約20項目についてディープシークが性能比較をしたところ、過半の項目でオープンAIなどアメリカ勢の最先端モデルを上回ったという。

【オープンソース】
ディープシークは誰でも利用可能な「オープンソース」として公開されているAIモデルを活用したとみられています。既存のAIモデルを「先生役」として、その入力と出力のデータを新たなAIモデルの学習に使うことで大量のデータを集める手間を省くことができたと言われています。ディープシークは公開技術を巧みに組み合わせて良いとこ取りすることで、ライバルを上回る性能を引き出したと考えられています。

ディープシークが公開した技術論文によると、AIの処理を複数の専門タスクに分け、分野に応じて必要な部分のAIモデルだけを動かすことで処理を効率化。AI開発で「省エネルギー化」を進め、先端半導体への依存度を減らしています。

ディープシークの手法は、先端半導体を大量に使ったデータセンターを構築してAIにデータを学ばせ、その性能を高めていくグーグルやマイクロソフト、オープンAIといったアメリカテック企業とは全く異なるものです。

■これまで信じられてきた常識が覆る可能性

これまで多くのAI開発者の間では、データ量や計算資源が大きいほど性能が高まる「スケーリング則」が信じられています。この法則を根拠に、オープンAIやソフトバンクグループなどは1月、AIの開発インフラに5000億ドル(約77兆円)規模の資金を投じると表明。グーグルやメタなども開発基盤に巨費を投じています。

低コストで高性能な生成AIモデルを開発したディープシークの登場により、「スケーリング則」の法則が崩れる可能性があり、そうなると、AIの競争ルールが書き換わることになると、株式市場は警戒感を高め、「ディープシークショック」が起こりました

1月27日には、生成AI市場でアメリカの技術優位が崩れるとの見方から半導体大手エヌビディアの時価総額が91兆円吹き飛びました。これは、トヨタ自動車の時価総額の2倍の額。影響の大きさがわかります。

また、27日のアメリカ株市場では前日比17%ダウン日経平均株価が2日間で900円ダウン。半導体検査装置のアドバンテストが11%安、製造装置のディスコが3%安。電線大手のフジクラも9%下げました。

世界経済をけん引しているAI関連銘柄が軒並み株価がダウン。今後のディープシークの動きが注目されています。

■ディープシークは、なぜ低コスト高性能のAIモデルが開発できたのか?

ディープシークの正式社名は「杭州深度求索人工智能基礎技術研究」。1980年代生まれ、梁文鋒氏が2023年に杭州市で設立。AI研究で知られる浙江大学出身。現在、約140人の開発チームを持ち、社員は20代中心と若く、全員が海外経験のない本土人材という。数学オリンピックの勝者など有名人も多いという。

ディープシークが低コスト・高性能のAIモデルを開発できた背景に、アメリカが発動した対中規制によって生成AIの開発に必要なエヌビディアの最新半導体が入手できないという制約があり、その制約から新たな発想にたどり着く原動力になったとの見方があります。

また、アメリカテック企業のような資金力がないため、AIの学習過程を絞り込まざるを得ない状態で、AIに人間のような推論能力を持たせ、知らない問題でも思考の末に答えを導く「自己進化」を可能としました。生成AIには、主にデータを学ばせて回答の精度を上げる「学習」と、利用者からの質問を受けてAIが回答を導く「推論」の2つの動作があり、ディープシークは後者の能力を引き出すことに注力したと言われています。

さらには、半導体のメモリ使用量を大幅に減らすために、効率的な構造設計を実現。アドバンスト・マイクロ・デバイス(アメリカ)と提携し、同社の半導体とソフトを活用してチャットGPTに匹敵するAIの機能強化に活用したとされています。

■今後の影響について

ディープシークに対してはオープンAIの技術を不正に利用し、情報保護の体制も不備だといった指摘が出ています。また、アメリカは、半導体の対中輸出規制を強化してきましたが、依然抜け穴が大きいとある米議員は指摘しています。そうした点から、中国企業への規制がさらに強化されるのかどうかという点がひとつの焦点となると考えます。

もうひとつの焦点は、低コスト生成AIモデル開発の促進の流れです。こうした取り組みは生成AIの課題である電力使用量の抑制につながり、コスト低減技術の進展は、ディープシークの将来いかんに関わらず、広がっていくと考えられます。

その一つの代表企業が、日本発のAIユニコーンであるSakana AI(サカナAI)。公開済みの複数のAIモデルを掛け合わせて短期間でより優れたAIモデルを生み出す手法を発表し、注目が集まっています。

こうした低コスト生成AIモデル開発の流れから、生成AIを製品やサービスに組み込んでいるアメリカ企業の株価は、コスト低減への期待から上昇しました。

資金力がある企業が勝者となるこれまでの常識を崩していくという点では、健全な競争環境が拡がり、生成AIがより社会に浸透していく分岐点になる可能性があり、そのけん引役代表のディープシークに今後も注目していきたいと思います。

いいなと思ったら応援しよう!