見出し画像

無料ユーザーでも使える!OpenAI o3-mini 解説

※ 本記事は、OpenAI o3-mini の公式情報をもとに、実際の利用例を交えながら作成しています。利用の際は、必ず公式情報をご確認ください。

https://openai.com/index/openai-o3-mini/


OpenAI o3-mini の概要

OpenAI o3-mini は、最新の理数系(STEM)分野に特化した小型モデルです!

従来の大型モデルに比べ、コスト効率が非常に高く、数学、科学、プログラミングなどの分野での質問や問題解決に優れた性能を発揮します。
特に、学校の授業や課題作成において、短時間で正確な回答を得ることができる点が大きな魅力です。

さらに、今回のアップデートにより、ChatGPT の無料版でも「Reason」モードを選択することで o3-mini を利用できるようになっています!


主な機能と特徴

理数系分野に最適化された高い思考力

o3-mini with medium reasoning effort matches o1’s performance in math, coding, and science, while delivering faster responses

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

と書いてあり、

o3-mini は、数学や科学、プログラミングの問題に対して、速く正確な回答を提供するとのことです!

たとえば、複雑な数式の計算や理科の実験結果の解説も、短い時間で行えるため、授業準備の時間短縮につながりますね。
あとはやっぱり、共通テストとかそういうテスト系の解答解説とか、それを応用した演習問題作りとかでも使えそうですね🤔

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

競争数学(AIME 2024)では、o3-mini high はこれまですごかった o1 を上回っていますね!

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

博士レベルの科学問題(GPQA ダイヤモンド)では、o1 と o3-mini が同じくらいですね。

これだと、o3 が出てくるとどうなるんだ!?
どれだけ優秀なの!?

となりますね笑

ここまで、まだ o3-mini はまだそんなに優秀じゃないの?と思われる方もいるかなと思います。

次の指標は良くなっていることが、もう少しわかるようになっていて、

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

AIの性能評価や検索結果のランキングなどで見かける「@1」「@4」「@8」といった「@k」という表記は、AIが出力する複数の候補の中で、どれだけの確率で正しい答えを含んでいるかを示す指標です。

主にAIの検索や生成タスク、問題解決能力を評価する際に使われます。

例えば、「@1 = 70%」 という結果がある場合:

  • 「AIが出した1つ目の回答が、70%の確率で正解を含んでいる」という意味です。

@1(トップ1の精度)

  • AIが生成した1番目の回答が正解である確率。

  • 「1発で正解を出せるか」を評価。

  • 精度が高いほど、最初の回答が信頼できる。

例えば、

  • 検索エンジン:「この本の著者は?」と質問した際、1番目の回答が正解なら成功。

  • 翻訳AI:「この英語の文章を訳して」と依頼し、最初の訳が正しい確率。

  • プログラミングAI:コードのバグ修正を依頼し、最初に出た修正コードが正しい確率。

@1が高いAIは、一発で正確な答えを出せる優秀なモデル!

@4(トップ4の精度)

  • AIが生成した上位4つの回答のうち、1つでも正解を含む確率

  • 「1発で当たらなくても、選択肢を増やせば正解にたどり着けるか」を評価。

例えば、

  • 質問応答AI:「おすすめの数学の参考書は?」と聞いた際、上位4冊のうち、少なくとも1冊が本当におすすめできる本である確率。

  • プログラミングAI:「このバグの解決策を教えて」と依頼したとき、AIが提案した4つのコードのうち、1つでも正しく動く確率。

  • 画像認識AI:「この写真の動物は?」とAIに判別させたとき、上位4つの候補(例えば「犬」「オオカミ」「柴犬」「ハスキー」)の中に正解が含まれている確率。

@4が高いAIは、1発で当てるのは難しくても、選択肢の中には正解が含まれている可能性が高い!

例えば生徒がAIに質問したとき、「最初の回答が正しいか(@1)」、
「いくつか選択肢を見れば正解があるか(@4, @8)」でAIの実力を測れます。

例:「この数式の解き方を教えて!」

@1が高いAI → 1回で正しい解法を提示する。 @4が高いAI → 上位4つの解法のうち、1つは正しい。 @8が高いAI → いろんな解法を提示し、その中に正解がある。

モデルの速度とパフォーマンス

With intelligence comparable to OpenAI o1, OpenAI o3-mini delivers faster performance and improved efficiency. Beyond the STEM evaluations highlighted above, o3-mini demonstrates superior results in additional math and factuality evaluations with medium reasoning effort. In A/B testing, o3-mini delivered responses 24% faster than o1-mini, with an average response time of 7.7 seconds compared to 10.16 seconds.

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

とあるように、

A/B テストというもので、o3-mini は o1-mini よりも 24% 速く応答し、平均応答時間は o1-mini の 10.16 秒に対して 7.7 秒だったということです。

January 31, 2025, OpenAI o3-mini, Pushing the frontier of cost-effective reasoning.

速度も上がっています!

利用方法と留意点

利用方法

ChatGPT のモデル選択メニューから「o3-mini」を選択するか、

無料プランの場合は、プロンプトのところにある「理由(Reason)」モードで利用可能です。

おわりに

OpenAI o3-mini は、数学や科学、プログラミングの授業、さらには課題作成など、さまざまなシーンで活用できます。

無料ユーザーも「理由(Reason)」モードを選ぶことで利用できるため、多くの方で試すことができます。

ぜひ、この機会に o3-mini を試してみて、日々の授業準備や教材作成にどのような変化がもたらされるか、その可能性を体感してください!

いいなと思ったら応援しよう!

けいすけ
何かと0から1を作るのは大変だと思います。学校はどこも似たような問題課題に対応していると思います。それなのに、先生って自分だけで頑張ろうとするんですよね。ボクの資料やnoteが1になって、学校ごとの現状に合わせてカスタムしていただければと思います‼️