ChatGPT「o3」-最もAGI(汎用人工知能)に近いAIの登場。OpenAIの12日間ライブ【後半まとめ】
OpenAIが開催した12日間のライブ配信、後半戦では、特に注目を集めているのが、新モデル「O3」の登場です。人間の専門家レベルの知能を持つとされるこのモデルは、AGI(汎用人工知能)評価テストで75%以上という驚異的なスコアを記録。また、ChatGPTのWeb検索機能強化、プロジェクト機能実装など、私たちの仕事や生活を一変させる可能性を秘めたアップデートが目白押しでした。後半6日間の重要発表を、ダイジェストで解説します。
1.はじめに
今年も残すところあとわずかとなりました。そんな中、ChatGPTの開発元であるOpenAI社が12日間連続でライブ配信を実施し、様々な発表を行いました。前回の記事では前半6日間の内容をご紹介しましたが、今回は後半6日間の模様を詳しくお伝えします。なんと、最終日の発表では、次世代モデルと呼ぶにふさわしい、非常に賢いAI「o3」がお披露目されたのです。このo3をはじめ、後半の6日間でも重要なアップデートが多数ありましたので、今回の記事でまとめて解説いたします。
2.生放送の告知
ここで、年末の特別ライブ配信のお知らせです。12月26日夜10時から、Voicyにて生放送を行う予定です。今回は、書籍『ChatGPT最強の仕事術』の著者であり、YouTubeチャンネル「リモートワーク研究所」(登録者数10万人)で質の高い生成AI関連情報を発信されている池田朋弘さんとコラボ配信でお届けします。
池田さんとは、最新著書『Perplexity 最強の検索術』についてもVoicyでご紹介させていただいたり、以前YouTubeでご一緒させていただいたりと、ご縁があります。今回のライブ配信では、Voicyの生放送とX(旧Twitter)のスペース機能を同時利用し、対談形式の生放送を行います。
テーマは「2024年を振り返り、2025年のAI活用を考える」。皆様からの質問も事前に受け付けており、取り上げてほしいテーマなどをGoogleフォームからお送りいただけます。詳細については、記載のURLから生放送の開催場所や質問フォームをご確認ください。12月26日夜22時からの生放送、どうぞお楽しみに。
1〜6日目までのおさらい
12日間の前半(1~6日目)については、前回のnote記事で言及しました。詳しくはこちらをお読みください。
以下は、概略です。
1日目 OpenAIの新しい最先端AIモデル「o1」の正式リリースとChatGPT Proプラン(月額200ドル、約3万円)の発表
「o1」は、これまでのChatGPTに組み込まれていたGPTシリーズとは別系統として開発が進められ、じっくりとステップバイステップで考え、一つの答えを出すという特徴があります。数学、科学、プログラミングなどに特に強く、博士号レベルの問題において人間の専門家以上の成績を収めています。ChatGPT Plus(月額20ドル)のユーザーは回数制限付きでo1を使用でき、新設されたChatGPT Pro(月額200ドル)では、o1の使い放題に加え、さらに上位モデルのo1 Proモードも利用可能です。
2日目 o1のファインチューニングに関する研究プログラムの発表
o1モデルを特定業界や分野に特化した知識で微調整できる機能が紹介されました。
3日目 話題の動画生成AI「SORA」が正式リリース
ChatGPT有料プランユーザーは追加料金なしで利用できるようになりました。
4日目 Canvas機能の正式版リリースとPythonコードのその場でのデバッグ機能の追加
5日目 Apple製品との統合について詳細な説明
iPhoneやMacに搭載されるApple Intelligenceとの連携が紹介されました。Siriで対応できない高度な質問をChatGPTに受け渡す機能や、文章執筆のライティングツール、画像解析のビジュアルインテリジェンス機能なども発表されています。
6日目 ChatGPTとのリアルな音声会話機能である「高度なボイスモード」が強化
カメラ機能を使って映像を見せながらの会話や、画面共有機能が追加されました。この機能は今後パソコン版のChatGPTにも導入される予定で、Excelなどのソフトウェアを画面に表示しながら、その場で説明を求めることができるようになります。
7日目 新機能「プロジェクト」(Projects)
7日目に発表されたのは、ChatGPTに新しいチャット管理機能「プロジェクト」が追加されたことです。従来のChatGPTでは、チャット履歴は保存されるものの整理が難しく、過去のやり取りを探すのが煩雑でした。このプロジェクト機能を使えば、自分の好きなようにフォルダを作成し、そこにチャット履歴を保管していくことができます。
例えば、「文章執筆」というプロジェクトを作成し、関連するチャット履歴をまとめて管理できるイメージです。さらに、このプロジェクト機能は単なるフォルダとしてだけでなく、プロジェクト内のチャットに対してデフォルトで適用されるカスタム指示を設定できます。
例えば、「文章執筆」プロジェクト内で新規チャットを開始する際、「私の名前はたてばやし淳です。たてばやし淳という名前で相手へのメールを執筆してください」といった指示を毎回入力する手間が省けます。ChatGPT自体にもカスタム指示機能はありますが、全チャットに適用されるのに対し、プロジェクト機能では特定のプロジェクト内でのみ有効となります。
加えて、プロジェクト内にファイルをアップロードして参照させることも可能です。例えば、自社の商品一覧表をアップロードしておけば、「メール執筆:当社の商品の中から適切なおすすめ商品を提案する返信メールを作成してください」といった指示が可能になります。
通常、ChatGPTは企業固有の情報は持ちませんが、ファイルとして知識を与えることで、それを参照しながらタスクを実行できるのです。個人的には、このプロジェクト機能は非常に便利で、日々活用しています。今回の発表の中で、最も実用的で使いやすいアップデートかもしれません。
8日目 「ChatGPT Search」(検索機能)の強化
8日目には、ChatGPTのウェブ検索機能が大幅に強化され、高速化。さらに、これまで有料プラン限定だった最新検索機能が無料ユーザーにも開放されました。また、リアルタイム音声会話が可能な高度なボイスモードにも、今後ChatGPT Searchが搭載される予定です。
ChatGPTに搭載されている検索機能がより高速かつ便利になり、これまで有料プランユーザーのみが利用可能だった最新情報を用いた検索機能が、無料アカウントでも利用できるようになったのです。ChatGPTの入力ボックス下部に表示される検索アイコンをクリックした状態で質問や命令を入力すると、ウェブ検索結果を基に応答を生成します。
これにより、旅行やレストランの検索、ローカル情報など、より正確な回答が得られるようになりました。また、企業リサーチやリアルタイムな情報(今日の天気やサッカーの結果など)についても、精度の高い回答が期待できます。高度なボイスモードでも、このChatGPT Searchが利用可能になる予定です。
個人的には、英会話学習で高度なボイスモードを活用しているため、検索機能が追加されることで、興味のあるITニュースを検索して読み上げてもらったり、ニュース記事を中学生レベルの英語にリライトさせてリスニング練習に活用したり、ニュースをテーマに英会話を楽しんだりと、幅広い学習が可能になるのではないかと期待しています。まだ私のアカウントでは高度なボイスモードでの検索機能は有効化されていませんが、一部ユーザーはすでに利用できているようなので、いずれ使えるようになるだろうと楽しみにしています。
9日目 「o1」のAPIなど
9日目は、エンジニアやシステム開発者向けの発表が中心でした。OpenAI DevDayのミニ版と位置付けられており、開発者向けの新機能などが紹介されました。専門的な内容のため、ここでは概要のみに留めます。
発表内容は主に2つ。1つ目は、最新AIモデル「o1」のAPIが発表されたこと。2つ目は、リアルタイムな音声応答を可能にするAPI機能が強化され、料金が安くなったことです。
これにより、システム開発にリアルタイムな音声会話機能を組み込みやすくなったり、チャット機能のリアルタイム性が向上したりすることが期待されます。エンジニア界隈では、今回のモデルアップデートは概ね好評のようです。
10日目 電話回線への対応
10日目には、ChatGPTがアメリカの電話回線に対応したことが発表されました。これまでChatGPTは、ウェブサービスやパソコンを通じて利用されてきましたが、電話番号を通じて音声会話が可能になったのです。
ただし、現時点ではアメリカの電話番号のみの提供であり、日本から利用する場合は国際電話となるため、まだ試していません。
また、英語圏で広く利用されているメッセージングアプリ「WhatsApp」でもChatGPTとのチャットが可能になりました。こちらは無料で利用でき、おそらく内部では軽量版のGPT-4o Miniが使用されていると思われます。
既存のChatGPTユーザーにとっては、電話やWhatsApp経由での利用は現状あまりニーズがないかもしれませんが、これまでChatGPTを利用したことがないユーザーや、無料で使い放題したいユーザーにとっては新たな選択肢となるでしょう。また、アメリカのユーザーであれば、インターネット接続がない状況でも電話回線を通じてChatGPTと会話できるというメリットもあります。
11日目 アプリ連携機能
11日目は、パソコン版のChatGPTアプリと他のアプリとの連携機能が発表されました。
例えば、メモアプリのNotionに書かれたメモをChatGPTで活用したい場合、従来はコピー&ペーストが必要でしたが、連携機能によって直接Notionの文章を取り込むことが可能になります。
連携対象となるのは、Notionの他に、Apple製品向けの開発環境であるXcodeや、iPhoneやMacの標準メモアプリであるApple Notesなどです。また、高度な音声モードでも連携が可能になります。
この連携機能は、特定のニーズを持つユーザーには非常に便利ですが、そうでないユーザーにとってはあまり恩恵がないかもしれません。今後の連携アプリの拡充や、より緊密なデータ連携に期待したいところです。
12日目 最もAGIに近い「o3」発表
そして最終日、12日目に発表されたのは、最新鋭のAIモデル「o3」です。まだ発表段階で、すぐに利用できるわけではありません。今後は安全性テストが行われ、来年1月末頃に安全性テスト参加者限定で早期アクセスが開始される予定です。その後、一般公開される見込みです。
このo3は、現時点で最もAGI(汎用人工知能)に近いAIモデルとされています。ライブ配信の冒頭で発表された「o1」が現状最も高性能なモデルですが、その次世代モデルが早くも登場した形です。o1からo3へと一気にナンバーが飛んだ理由としては、他社が「O2」を商標登録しているため、使用できなかったという裏話も明かされました。
o3の特筆すべき点は、各種ベンチマークテストでo1を大幅に上回るスコアを記録していることです。o1でも既に人間の専門家レベルの能力を発揮していましたが、o3はそれをさらに凌駕します。また、AIの性能評価自体が難しくなる中、AIが苦手とするタスクを集めたArcAGIという評価テストにおいて、o3は75%以上という驚異的な正答率を達成しました。ちなみに、o1の正答率は約30%程度です。この結果は、o3が人間のような汎用的な思考能力に非常に近づいていることを示唆しています。
しかし、この評価テストを作成した企業の見解では、まだ全ての質問に答えられているわけではないため、現時点ではAGIとは断定できないとのことです。o1が正式リリースされたばかりにもかかわらず、その一段上の性能を持つo3が既に開発され、安全性テストの段階に入っているという事実は、驚くべきスピード感です。
ChatGPTが登場した当初のGPT-3.5は、まだ不正確な情報も多かったですが、翌年にはGPT-4oが登場し、その性能に目を見張りました。その後、GPT-4oが登場しましたが、今回のo1からo3への進化は、それを遥かに上回る速さで進んでいます。このrapidな進化には、期待とともに、今後の動向に対するある種の畏怖の念すら覚えます。
まとめと今後への期待
この12日間のライブ配信では、実用的な機能から最先端のAI技術まで、幅広いアップデートが発表されました。土日を除いて2週間近くにわたり、毎晩日本時間の深夜3時から配信が行われ、その内容を理解し発信し続けることは大変な挑戦でした。
この期間中にはGoogleのGeminiについても大きなアップデートがあり、生成AI業界全体が目まぐるしく変化し、その速度は加速し続けています。
12日間の発表の中で、すぐに実務で活用できそうな機能としては、ChatGPTのキャンバス機能のアップデートや、高度な音声モードの機能強化、ビデオおよび画面共有機能などが挙げられます。また、動画生成AI「SORA」がChatGPT有料ユーザーに追加料金なしで提供されることも、実用的な進展として注目されています。
o1については、従来のGPTシリーズとは異なる特徴を持ち、より思慮深い回答や自然な文章生成が可能になっています。この活用のため、ChatGPT Proプランへの加入を検討する価値はありますが、すべてのユーザーにとって必要というわけではありません。
Excel関連の業務においては、画面共有機能を通じてChatGPTに直接質問できる機能に期待が高まっています。現在はMac版のChatGPTアプリでのみ利用可能ですが、Windows版での展開も待たれています。なお、GoogleのGemini 2.0ではすでにこの画面共有機能が実装されており、パソコン作業中に常にAIがサポートしてくれる世界が現実のものとなりつつあります。
特筆すべきは、o1が正式リリースされたばかりにもかかわらず、すでにその上位モデルであるo3の開発が完了し、安全性テストを残すのみとなっている点です。これはChatGPTの進化の速さを表しており、2022年11月のGPT-3.5から2023年春のGPT-4、そしてGPT-4を経て、o1からo3への急速な発展は、AIの進化が加速度的に進んでいることを示しています。
このような急速な進化は、私たちの働き方や生活に大きな変革をもたらす可能性を秘めており、今後も注目して見ていく必要があります。