OpenAIの戦略とは〜12日間連続発表の意図
OpenAIは、12月5日から平日は12日間連続で発表するとXで告知しました。12回のライブストリームを実施し、大小さまざまな新サービスを発表するということです。これまでOpenAIが予告しているものは、動画生成の「Sora」やGPT-4の次世代モデル、現在プレビュー版の「o1」などがあるが、これらの発表や進捗報告があると見られています。
5日から平日をカウントすると、20日まで連続で発表が行なわれることになります。OpenAIのサム・アルトマンCEOは、「素晴らしいものをシェアしますので、お楽しみください。メリークリスマス」とXに投稿しています。
余談ですが、OpenAI NewsroomのX投稿によれば、4日にアルトマン氏が社内共有した数字として、ChatGPTユーザーは毎週3億人で、ChatGPTで毎日送信されるユーザーメッセージは10億件、米国では130万人の開発者がOpenAIを使っていると公表しています。
12月8日現在、発表されてる内容について見ていきましょう。
1日目の発表は、次世代のAI言語モデル「o1(オーワン)」と、その高性能版を利用可能にする有料プラン「ChatGPT Pro(チャットGPTプロ)」です。AIでよく聞く「GPT」というモデルは、私たちが文章で質問したり会話したりすると、それに応じた答えや提案を返してくれる仕組みです。これまでGPT-4などが使われてきましたが、今回の「o1」はその改良型で、より高度な知的タスクに対応するのが強みとなります。動画中で「o1 is a pretty big step forward」とあるように、このモデルは「o1プレビュー」と呼ばれた試験版から、大幅に知能や速度がアップしています。「数学競技レベルの難問」「複雑なコード解析」「専門分野の深い知識」を必要とする質問に、より正確で素早い回答を返すことが可能になったそうです。
o1がすぐれていると思える点が2つあります。
1つ目は、「o1が回答する前に、内部でしっかり考える」機能を取り入れたことです。動画中で「o1 is the first model we’ve trained that thinks before it responds」と解説されているとおり、質問に対して即答するのではなく、裏側で論理的な思考プロセスを踏んでから答えるようになりました。そのおかげで、答えの正確性や説得力が向上しています。
2つ目は「マルチモーダル対応」です。これは、テキスト(文章)だけでなく、画像を一緒に読み解ける機能です。例えば、手書きのメモや図をアップロードして、その内容をもとに数値計算や分析を頼むことができます。「Now, the o1 model… is able to reason through both images and text jointly」と語られているように、「画像+テキスト」をセットで理解することで、これまで以上に幅広いタスクが可能になります。
動画中のデモでは、宇宙空間に設置された1ギガワット(巨大な発電量)のGPUデータセンターを冷却する巨大な放熱パネルの面積を求めるというSFのような難問が提示されました。本来なら専門家が計算式と物理・熱力学の知識を総動員して考えなければならない問題です。しかし、o1は手書きの図をもとに「約2.42百万平方メートル」という驚くほど具体的な推定値を出してみせました。このような複雑な理系タスクにも、即座に対応できる柔軟性が魅力です。
o1と併せて新しい有料プランも発表されました。「もっとハイレベルな使い方をしたい」「ビジネスや研究で思いっきりAIを使い倒したい」というユーザー向けに用意されたのが、新料金プラン「ChatGPT Pro」(月200ドル)です。「People really use it a lot and they want more compute than $20/month can buy」と言及されているように、これまでの有料プラン(月20ドル)では物足りない、より強力な処理能力を求めるプロフェッショナル向けです。
ChatGPT Proでは、o1の「Proモード」を利用できます。これは通常版のo1をさらに計算リソース面で強化し、難しい問題に対してより長い“考える時間”を与えることで、さらに正確で頼れる回答を返せる仕組みです。デモでは化学分野のハイレベルな問題に挑戦させたところ、数十秒から最大で数分考え込み、最終的に正解にたどり着きました。複雑な専門知識を必要とする課題に真価を発揮するため、「研究開発者」「高度な分析を要する職種」などにとって、頼もしいパートナーとなること間違いなしです。
こんな発表を聞くと専門家ではない人の中には、「こんなすごいこと言われても、自分には関係ないのでは?」と思う人がいるかもしれません。しかし、今回の改善点には、「速度アップ」「簡単な質問への応答の即時性」「間違いの減少」など、日常使いに役立つメリットも含まれています。例えば、単純な歴史の質問ひとつ取っても、これまでより素早く、正確な答えが返ってくるのです。さらに「マルチモーダル対応」は、手描きのレシピやメモを撮影してアップロードすれば、その内容をAIが理解し、整理してくれるといった、身近な活用法も将来的には期待できます。誰にでも便利で手軽に利用できるAIになることが予想されます。
2日目の発表は、「Reinforcement Fine-Tuning」(RFT:強化学習ファインチューニング研究)プログラムです。強化学習ファインチューニングとは、数十から数千の高品質なタスクを用いてモデルをカスタマイズし、提供された参照回答でモデルの応答を評価する新しいモデルカスタマイズ技術のことです。モデルが類似の問題をどのように推論するかを強化し、その分野における特定のタスクに対する精度を向上させることができます。結果に客観的に「正しい」答えがあり、ほとんどの専門家が同意するようなタスクに優れていると考えられます。このプログラムは、医療、法務、金融、工学などの専門性が高い分野における応用が期待されており、OpenAIも研究機関、大学、企業などを対象に、このプログラムへの参加を呼び掛けています。参加者はOpenAIの強化学習ファインチューニングAPIにα版でアクセスし、ドメイン固有のタスクでこの技術をテストすることができることになります。また、自社や研究チームが保有する独自データセットを活用し、特定のタスクに特化したAIモデルを開発することが可能です。OpenAIは参加者からのフィードバックを受けてAPIの改善を図り、2025年初頭の一般公開を目指します。
実際の応用例として、法律分野ではトムソン・ロイターがRFTを使用し、法務アシスタントAIを開発しました。このAIは、法務専門家が直面する高度な分析タスクを効率的に支援するために設計されています。一方、医療分野では、バークレー研究所の研究者がRFTを用いて、希少遺伝病に関する研究を進めています。この取り組みでは、患者の症状データをもとに原因となる遺伝子を特定するモデルが開発されました。このモデルは、約1100件の症例データをもとに学習され、比較的小規模なデータセットでも高い精度を実現する成果を挙げています。
これらの事例は、RFTがどのようにして専門性の高い領域での課題解決を可能にするかを示す具体例です。さらに、RFTは「ほとんどの専門家が同意する客観的に『正しい』答え」を必要とするタスクに特に効果的であり、専門性の高い分野において幅広く応用できる可能性があります。今回のプログラムに参加することで、AI技術を活用した課題解決や業務効率化の可能性を広げることができます。ただし、参加枠には限りがあるため、興味を持つ研究機関や企業は早めに応募することが推奨されます。
o1、ChatGPT Pro、Reinforcement Fine-Tuningプログラム、どの発表も1つだけでも大きな発表であるのに、それが2日連続で発表されたことが驚きです。OpenAIがどれだけ多くの研究をし、各々を完成に導ける底力があるのかを垣間見た気がします。こんな発表があと10日間も続くとなると世界中のAI関係者はどのような気持ちなのでしょうか。期待に胸を膨らませる人、新たな技術にいち早く手を出そうと考えている人、先手を取られて悔しがる人、いろいろな人がこの10日間を各々の立場で過ごすことになります。どのような立場であったとしても、新しい技術が発表されることで、AIを取り巻く環境が変化することで、次の段階へ進むのですから、否定的な人はいないはずです。これからの発表を楽しみにしながら残り10日間を過ごしてみませんか。