
chatgptがo1を発表。概要をまとめてみた。
◆概要
OpenAIがChatGPTに新しいO1モデルを9/12に発表
O1モデルは複雑な推論や数学、科学、プログラミングに特化した大規模言語モデル
→推論とは予想か。O1の特徴は、回答前に内部で長い思考チェーンを生成し、精度の高い回答を出す
→CHATGPTsearchを意識している可能性あり。ホットドッグがサンドイッチかどうかの質問に対して、定義に基づいて見解を提案するなど、複雑な課題に対しても考え抜くことができる。
GPT-4に比べて、O1は全てのユースケースで優れているわけではなく、画像解析やコードインタープリタなど特定の機能ではまだGPT-4が最適
→推論や数学、科学、プログラミングにの分野についてはO1を使ったほうがよい。O1には「プレビュー」と「O1Min」の2つのモデルがあり、後者は高速
実務への活用としては、プログラム生成や複雑な資料構成の作成が簡単に行える
ベンチマークでは、O1は科学的な推論で上位11%に入り、GPQAテストでは博士号レベルの能力を超える精度を示した。
※物理学に関する質問にAIがどの程度正確に回答できるか評価するテストのことを指すO1では、プロンプトが優先で直接的なものである方が効果的。思考チェーンは内部で実行されるため、ステップバイステップの指示は不要。
実際に使ってみると、特に難しい問題を解決する際にその能力が発揮されるが、日常的な使い方では違いが分かりにくい。
O1モデルは、数理的な問題や複雑なタスクで優れたパフォーマンスが見られるが、すべてのユーザーにそのすごさが伝わるわけではない。