「12 Days of OpenAI」総まとめ
ごあいさつ
株式会社コーポレートGPTでCAIOを務めております、工藤照久と申します。2024年12月5日から12日間にわたり開催された「12 Days of OpenAI」では、新世代モデル「o1」「o3」、新機能「Canvas」「Projects」など、非常に多岐にわたるアップデートが次々と発表されました。
本記事では、この盛りだくさんの情報を一挙に整理し、皆様が生成AIを活用する上でのヒントや導入検討の材料としてお役立ていただけるよう、ポイントをまとめてご紹介いたします。AIが私たちの業務や学習環境にどのような変革をもたらしているのか、一緒に見ていきましょう。
Day 1 o1モデル正式リリース & ChatGPT Proプラン発表
o1モデル正式リリース
プレビュー版から正式版へ移行。応答速度や複雑問題への対応力が大幅に向上
上位モードの「o1 pro」では数学・プログラミング分野などでより精密な回答を実現
ChatGPT Proプラン(200ドル/月)導入
o1/o1 proへの無制限アクセスやAdvanced Voice機能などを含むフル機能プラン
Plus/Teamプランでもo1の利用自体は可能
コンテキストウィンドウ拡張
Free:8Kトークン
Plus/Team:32Kトークン
Pro/Enterprise:128Kトークン
大規模文書を扱う際の利便性が飛躍的に向上
Day 2 強化学習によるファインチューニング(RFT)研究プログラム拡大
RFT (Reinforcement Fine-Tuning)
少量の専門的タスクと回答を使い、モデルを強化学習ベースで微調整
医療・法律・金融など、明確な正解が存在し合意が得やすい分野で検証を拡大
2025年初頭に一般公開予定。現段階では研究機関やエンタープライズからのフィードバックを収集中
Day 3 動画生成ツール「Sora」正式展開
Sora Turbo
テキストから高品質な動画を数十秒規模で生成可能
解像度は最大1080pまで対応し、テキスト・画像・動画を組み合わせたストーリーボード編集も
Proプラン限定で人物生成に対応
全ての動画に透かしやC2PAメタデータを付与し、生成出所を明確化
Day 4 Canvasの解放(無料ユーザー含む全ユーザー対象)
Canvas機能
従来はPlus/Team向けベータだったが、全ユーザーに開放
テキストチャット+ドキュメント編集を同時に行え、ChatGPTと共同編集がしやすい
Canvas内でのPython実行
WebAssemblyベースで主要ライブラリも利用可能
コードを書いてそのまま実行・可視化まで完結
Day 5 Apple Siri(Apple Intelligence)との統合 & iOS 18.2
SiriがChatGPTを呼び出し
文章生成や画像解析、カメラ連動での映像解析などをシームレスに実行
匿名利用オプション
アカウント未連携時にはOpenAI側でのログ保存なし
対応地域・言語
現時点では英語圏が中心。2025年以降に日本語などへ拡大予定
Day 6 Advanced Voice Mode強化 & Santa Mode
動画・画面共有機能の追加
音声やテキストだけでなく、リアルタイムでカメラ映像・画面を共有しながらやりとり可能
サンタモード(12月限定)
サンタ姿のChatGPTと音声会話を楽しめる季節イベント
Advanced Voice利用上限が一度リセットされる特典つき
Day 7 Projects機能の追加
プロジェクト単位で情報管理
チャットや資料をまとめて管理し、ファイルをアップロードして参照可能
RAG検索との組み合わせで大規模情報を活用しやすい
カスタムインストラクション
プロジェクトごとにトーンやスタイルを固定し、回答の一貫性を高める
Day 8 Search機能強化(無料ユーザーにも開放)
リアルタイムWeb検索
従来Plus/Pro限定だった機能がログイン中の無料ユーザーにも解禁
音声モード中の検索や画像プレビュー、地図連携などが高速・スムーズに
Day 9 o1モデルAPI正式版 & Realtime API改善
o1 APIの正式提供
「o1-2024-12-17」スナップショット公開。VisionやFunction calling対応を強化
Realtime APIの改善
WebRTC対応で音声・テキスト対話が安定化
GPT-4o音声入力トークンの価格が約60%引き下げ
Preference Fine-Tuning導入
トーンやスタイルといった主観的好みを反映させやすい新しい微調整手法
Go/Java向け公式SDKベータ版
Python/Node/.NETに加えGo/Javaでも公式サポート開始
Day 10 電話・WhatsApp対応
電話でChatGPT
米国内向け専用番号へ電話をかけると音声通話でChatGPTと対話可能
月15分の無料枠あり、アカウント連携で拡大
WhatsApp連携
世界的に利用者の多いWhatsAppでもChatGPTとテキストでやりとり可能
Day 11 Desktop App連携拡大
Warp/Xcode/Notionなど主要アプリとの連携
コード生成から文書校正までChatGPTがサポート
Advanced Voice Mode対応
音声での指示や文書編集がPC上でよりスムーズに
Day 12 新世代モデル「o3」「o3 mini」発表
o3モデル
数学・プログラミング・科学分野で専門家以上の水準を目指すフロンティアモデル
難関ベンチマーク「ARC-AGI」で87.5%という画期的スコアを記録
o3 mini
コストパフォーマンスに優れた軽量版。思考時間(低・中・高)を調整できる「アダプティブ・シンキング・タイム」を搭載
Deliberative Alignment
モデル内部の思考プロセスと安全ポリシーを統合し、安全性をさらに強化
2024年1月末にo3 miniを先行リリース。その後、段階的にo3を公開予定
「12 Days of OpenAI」を踏まえた2025年度の生成AIトレンド予測
「12 Days of OpenAI」で発表された最新の生成AI技術を踏まえ、来年度の生成AIには以下のようなトレンドが予測されます。
高度な推論能力を持つAIモデルの普及
OpenAIの新モデル「o3」「o3 mini」などにより、複雑な問題解決能力が一段と強化
科学、コーディング、数学などの分野でAIの活用がさらに進むと予想
マルチモーダルAIの進化
テキストから動画を生成する「Sora」のリリースで、AIが扱うデータの種類が増加
クリエイティブ業界やエンターテインメント分野でのAI活用が加速
AIエージェントの主流化
OpenAIは、AIエージェントが2025年までに主流になると予測
ユーザーの指示に基づき自律的にタスクを遂行するエージェントが日常やビジネスを効率化
強化学習型ファインチューニングの実用化
業務に特化したAIモデルの精度向上を目的とした強化学習型ファインチューニング研究が進行中
各業界のニーズに合わせたカスタマイズAIの開発が一層促進される見込み
生成AIの実用性と信頼性の向上
高度化するAIに対し、誤情報生成(「幻覚」問題)への懸念も依然として存在
AIモデルの精度向上に加え、倫理ガイドラインの整備やユーザー教育が課題となる
まとめ
「12 Days of OpenAI」は、初日のo1リリースから最終日のo3発表に至るまで、AIの進化を実感できるアップデートが惜しみなく公開されました。
特に注目は、数学・プログラミング・科学分野 で人間専門家水準を超える可能性を示す「o3」モデルです。2024年1月の一般公開が今から待ち遠しいですね。
エンタープライズやコーポレート領域での導入を検討されている方にとっては、RFTによる専門分野への適応やProject機能、Search機能の一般開放 など、実務レベルで活用しやすいアップデートが盛りだくさんです。
生成AIの活用シーンは今後もさらに広がっていくことが予想されます。新モデルの性能や安全性の進化をウォッチしつつ、ぜひ皆さんの業務に役立てていただければと思います。