12 Days of OpenAI: Day1のまとめ
Day1をまとめましょう。
リアルタイム視聴時の動画は非公開となり、冒頭の動画をカットした版が公開されております(下の動画)
概要
OpenAIが「12 Days of OpenAI」と題し、12日間にわたり新しい機能やモデルのデモを行う企画の初日の内容。
発表された内容
新モデル「o1」
性能向上:
GPT-4.0やo1-preview版と比較し、賢く、速く、マルチモーダル(テキストと画像を扱える)対応。
高精度な応答を提供、ヒューマンエラー率34%削減、応答速度50%向上。
ユースケース:
数学、プログラミング、科学的問題において大きな成果。
日常的な使用でも高速で高精度な応答を実現。
特徴:
「考えてから回答する」仕組みを採用。
マルチモーダル入力に対応し、画像や曖昧な質問にも効果的に対処可能。
ChatGPT Proの新ティア
概要:
月額$200で提供される新しいサブスクリプション。
o1モデル、音声機能(Advanced Voice)、o1 Pro Modeを無制限で利用可能。
o1 Pro Mode:
難解な問題に対して追加計算資源を使用して深く考えさせる機能。
信頼性が向上し、最も高度な科学・数学の問題にも対応可能。
デモンストレーション
o1の速さと精度のデモ
質問例: 「2世紀のローマ皇帝をリストアップし、彼らの治世や業績について教えてください。」
比較実験:
左: o1モデル
右: o1-preview版
結果:
o1モデルは約14秒で正確な応答を生成。
o1-preview版は約33秒かかった上、答えに不正確さが含まれることが多い。
ポイント:
o1モデルは処理速度が向上し、複雑な情報も的確にまとめられる。
人間評価では、o1モデルが誤答率を34%削減し、応答速度が50%向上した。
マルチモーダル(画像とテキストの組み合わせ)のデモ
課題例: 宇宙空間のデータセンター設計
手書きの簡易スケッチ(画像)をアップロードし、設計に必要な要件を分析。
問題内容: 1ギガワットのデータセンターを冷却するために必要な放熱パネルの面積を計算。
o1モデルの対応:
手書き画像から「1GW(ギガワット)」というパラメータを正確に読み取り。
宇宙空間特有の条件(例: 空冷や水冷が使えず、放熱パネルが必要)を考慮。
不足する条件(放熱パネルの温度)を認識し、適切な仮定(温度範囲)を設定。
結果:
必要な放熱パネル面積を2.42百万平方メートル(サンフランシスコの土地面積の約2%)と計算。
計算プロセスは簡潔かつ理論的な仮定で構成されており、信頼性が高い。
Pro Modeの活用例
課題例: 化学的なタンパク質設計問題
条件: 6つの具体的な基準を満たすタンパク質を見つける。
o1 Pro Modeの対応:
基準が明確な答えを導かない(複数の候補が考えられる)ため、モデルはすべての候補を評価。
各条件を満たすかどうかを1つ1つチェックし、最適な答えを選定。
結果:
問題を53秒で解決。o1-preview版では正解率が低かった問題も解決可能。
ポイント:
Pro Modeでは、追加計算リソースを活用し、より深い推論が可能。
今後の展開
開発者向け:
API対応を進め、構造化出力、関数呼び出し、画像理解機能などを追加予定。
開発者向け新機能の発表を今後も予定。
ユーモアの共有
サンタと「Reindeer Enforcement Learning(トナカイ強化学習)」に関するジョークで締めくくられた。
まとめ
o1モデルとChatGPT Proが、技術者や科学者だけでなく、日常利用者にとっても大幅な改善をもたらすことが強調された。今後の新機能や改善も期待される。