見出し画像

科学、数学、コーディングが進化!OpenAIがリリースした「o1-preview」「o1-mini」とは?

AI技術は日々進化しています。そんな中、OpenAIが発表したo1モデルである『o1-preview』と軽量版の『o1-mini』は、科学、数学、コーディングの分野で大きな進歩をもたらす新しいAIモデルです。

今回は、その特徴や使い方を分かりやすく紹介します。


「o1モデル」の主な特徴

『o1モデル』は以下の点で従来のAIより優れています。

1 高度な推論能力

• 物理、化学、生物学、数学などの難しい問題に対して、博士課程の学生と同等レベルの解答が可能です。
• 数学オリンピックの予選では、GPT-4が13%の正解率だったのに対し、『o1-preview』は83%の問題を正しく解答するなど、その推論力が際立っています。

o1モデルは「推論トークン」を使って、質問を細かく分解し、様々な方法を試しながら答えを出します。考える過程は内部で行われ、最終的な答えだけが表示されるので、より正確で役立つ回答が可能です。

推論モデル(引用:Open AIのWebサイト)

実際に、さまざまな人間が実施する試験や機械学習のモデルでo1モデルをテストしたところ、推論を重視するタスクの大半でGPT-4oを上回る性能を示しました。

ベンチマークテストの結果(引用:Open AIのWebサイト)

2 プログラミング能力の向上

• 論理的な思考が求められるコーディングタスクにおいても、優れた成果を発揮します。
• コーディングコンテストでの評価では、プログラミング大会「Codeforces」で参加者全体の上位11%に入るほどの実力を示しています。

3 強化された安全性

• セーフティ機能が強化され、誤った情報の生成を減らすための仕組みが改善されています。

Open AIのWebサイトより

ただし、現時点で他のGPTのように、Webブラウジングやファイルのアップロードなどの機能はありません。

「o1-preview」と「o1-mini」の違い

o1モデルは、「o1-preview」と「o1-mini」に分類されます。

o1-preview: 幅広い知識を活用して、難しい問題に取り組むためのモデル。科学や数学など、一般的な知識が必要な場面で活躍します。
o1-mini: 高速で低コストなバージョン。特にコーディングや数学、科学の問題を効率的に解決できるよう設計されており、膨大な知識が必要ない場面に最適です。

ChatGPT PlusやTeamユーザーは、今日から『o1-preview』と『o1-mini』を利用できます。モデル選択画面で手動で選べるようになっており、現時点では利用制限がかかっています。『o1-preview』は週30回、『o1-mini』は週50回まで使えます。将来的には、この制限の拡大や自動モデル選択機能の追加が予定されています。

o1モデル「o1-preview」の利用

STEP1 左上のメニューから「o1- preview」を選択

o1-previewを選択

STEP2 「ChatGPT o1-preview」と表示されていることを確認

o1-previewが選択された状態

STEP3 プロンプト入力後、思考プロセスを確認可能

思考プロセス

「o1-preview」と「GPT-4o」の比較

実際のプログラミングタスクで「o1-preview」と「GPT-4o」の性能を比較してみました。

下記のプロンプトを入力して出力を比較します。

1 タイピングゲームの実装

ブラウザでできるタイピングゲームをプログラムしてください。

# ルール
30秒の時間制限
制限時間は30秒をゲージで表示
制限時間以内にタイピングを完了を競う
過去3位までのランキングも表示
タイピングはローマ字入力

GPT-4oの場合)

30秒のタイマーとゲージ表示の実装には成功しましたが、肝心の問題が表示されないという不具合がありました。

GPT-4oで制作したタイピングゲーム

o1-previewの場合)

30秒のタイマー、ゲージ表示に加え、問題と回答が一致した場合にスムーズに次の問題に移ることができました。プログラムの完成度が高く、ユーザーの意図をしっかりと汲み取った実装ができています。

o1-previewで制作したタイピングゲーム

2 テトリスの実装

GPT-4oの場合)

ブロックが落ちて積み重なるところまで実装できたものの、右端の5マスを利用することができませんでした。また、ブロックの回転もできない状態でした。

GPT-4oで制作したテトリス

o1-previewの場合)

ブロックが落ちて積み重なるだけでなく、一列揃ったときにブロックが消える機能も実装されていました。また、ブロックの色も見やすいように変更され、右端までの移動も問題なく実現されていました。

ただし、2列同時に揃った時には1列だけ残るというバグが見受けられました。

o1-previewで制作したテトリス

これらの比較から、「o1-preview」も完璧ではないながら、プログラミングにおいて精度の高い実装を行えました。

未来の展望と可能性

「o1-preview」の登場により、科学、数学、コーディングの分野でAIが担う役割はさらに広がることでしょう。OpenAIは今後も「o1-preview」シリーズを進化させ、より多様なシーンでの活用を目指しています。「o1-preview」はGPT-4とは異なるシリーズとして位置づけられ、問題をより深く考えて解決する能力に重点を置いています。

将来的には、異なるAIシリーズが統合され、さらなる高性能なAIモデルが登場する可能性もあります。それが実現すれば、AIがより多様な問題に対応し、教育やビジネスなどさまざまな分野でのサポートが可能になるでしょう。これからのAI技術の進化に期待が高まります。


この記事が気に入ったらサポートをしてみませんか?