見出し画像

OpenAIの出し惜しみ vs Googleの背伸び


はじめに

2024年2月の生成AI競争の見取り図をお話しします。
2023年はNVidia, OpenAI, Microsoftが勝ち組でした。動きの速い生成AI業界、はたして逆転はあるのでしょうか。

Googleの背伸び

2023年12月にGemini (Ultra, Pro, Nano)が出ました。西欧チームはクリスマス休暇前にそんなにがんばってやらないだろうと思っていたので、驚きました。Genimi UltraはGPT-4を上回るという触れ込みでした。さすがGoogleです。今回の生成AI革命ももとをたどれば大規模並行学習を可能にするTransformerの発明が出発点です。もともとGoogleの技術なので本家本元がどうひっくり返すかは生成AI戦争の重要なポイントです。
Gemini Ultraのデモはさすがの内容で世界に衝撃を与えました。
Gemini Ultraが公開されていないのですが、2024年1月の時点ではGoogleは背伸びしているのではないかと思われています。

  • 動画の作り方:動画を直接Geminiが処理しているような作りになっているが、そうでないことをGoogleも認めている

  • GPT-4との比較:論文上はGPT-4を上回る性能をあげているが必ずしもGPT-4と同一条件で比較しているとも言えない

実際にGemini Ultraが公開されれば、やっぱり Geminiすげー、になるかもしれませんが、公開が待たれます。

OpenAIの出し惜しみ

OpenAIは2020年のGPT-3公開のときからすごいものができてしまったといいつつ公開しないというパターンでした。一時は狼少年扱いされていました。画像生成もすごいすごいといいながら公開せずにいて、Midjourneyがでてから話題を取られてあわてました。その結果が、ChatGPT のβリリースです。これは世界に衝撃を与えました。
2023年3月のGPT-4のプレスリリースのときにもナプキンにユーザインタフェースを描いてプログラムを書くデモを出しました。画像を認識する能力があったわけです。実際のGPT-4Vのリリースは2023年9月です。
GPT-4.5もできているが、出し惜しみして、Gemini Ultraの正式公開にぶつけてくるつもりという風評もあります。
何も進歩がなくてもOpenAIが打つ手はいくらでもあります:

  • 応答性能の向上:画像生成などの応答性能の向上

  • リミッターの緩和:3時間あたりのメッセージ数の上限の緩和

  • 料金の値下げ:一般料金、ENTERPRISE料金

  • GPTレベニューシェアリング:特定条件下でのレベニューシェアリング比率の引き上げ

多少は技術的な課題はありますが、以下のような対策も可能です。

  • トークン制限の緩和:入力できるトークンサイズの拡大

  • APIの改善(パラメータの追加、制限の緩和)

GPT-4.5, GPT-5がどこまで出来ているかわかりませんが、他社の最高レベルを見極めてから次の領域で勝負できるのがOpenAIの強みだと思います。

  • 精度の改善

  • マルチモダリティ(映像生成AI)

  • サービスとの連携(Office 365など)

  • GPTの個人、企業向けカスタマイズ(GPTsなど)

  • 前述の技術的進歩の要らない or 少なくて済む改善

2024年の展望

普通に考えればOpenAI+Microsoftの圧勝になりそうな2024年です。しかし、2022年の初頭に普通に考えれば人材豊富なGoogle有利だったのを1年でひっくり返したのがOpenAI+Microsoftだったことを考えれば、何が起こるかわかりません。ChatGPTが最初に出た時にOpenAIが100人程度の会社だったことを考えれば、世界のどこから伏兵が出てもおかしくありません。
MetaがOSSでLlama 2を公開し、Llama3を開発中であるので、だれでも必要なソースにはアクセスできます。

むすび

エコシステム的に考えればOpenAI+Microsoftが勝ちそうな2024年です。わくわくしながら見守りたいと思います。


いいなと思ったら応援しよう!