見出し画像

#105【GPT-4oとも比較】新モデル"o1"の実力と活用方法

おはようございます。



アナログな企業で生成AI普及を目論む3年目社員アヒルです。今欲しいものはバイタリティです。


さて、ChatGPTを開くと見慣れぬ2つのモデルが。


推論を得意とするChatGPT o1のプレビューモデルと、軽量モデルであるo1 miniが並んでいます。今回はこれらの実力と、おすすめの活用方法をご紹介します。



ChatGPT o1(オーワン)とは?


ChatGPT o1(オーワン)モデルは、OpenAIが2024年9月に発表した新しいAIモデルシリーズです。

2つのモデルの特徴をPerplexity AIでまとめてもらいました。

主な特徴

・より深く考える能力を持ち、複雑な推論を要するタスクに特化
・科学、コーディング、数学などの分野で高い性能を発揮
・o1-previewとo1-miniの2つのモデルがある

o1-previewモデル


・より高度な推論能力を持つ
・ChatGPT PlusおよびTeamユーザーに公開中
・現在は週に30メッセージの制限あり


o1-miniモデル


・基本的な能力を維持しつつ、処理速度と効率性を向上
・より軽量で高速なモデル
・現在は週に50メッセージの制限あり


使ってみた


普段通り、画面左上からモデルを切り替えられます。

それでは実際にGPT o1を使ってみます。


暇つぶしに:パズルを考えてもらう


まずは軽めのお題を。論理的な思考が必要になるナンプレ問題の作成と、その解答を考えてもらいました。

解いてみると特に間違った部分はなく、しっかりした問題になっていました。
解答はもちろん、解き方のヒントまで示すのにかかった時間はなんと3秒!

miniを使うと、まず速さに圧倒されます。


ビジネスに:お金の計算や意思決定を助けてもらう


次に、もう少し普段の業務に寄せた使い方をしてみます。

①損益分岐点の計算

ITパスポートでもお馴染みの損益計算。今回は過去の試験問題からお借りした問題を計算させてみます。

ご名答。


②費用対効果を考えてもらう

システム改修で自動化できたらなぁという作業について、GPT o1に相談してみました。

月給や費用は架空です。

上司を納得させる理由づけ、論理的な根拠の提示に使えそうです。


実力はいかに:東大入試を解いてもらう


推論が得意だというo1、果たしてどの程度の実力なのか、いきなりですが東大理系数学の過去問に挑んでもらいます。

今回のpreviewモデルはまだ画像の添付やファイルアップロード等には対応していないので、図を貼り付けることはできません。よって文章だけの確率の問題を与えてみました。

理系数学(2023年 第2問)

解答は、

1.  14/55
2.  103/168

もちろん解説は省略しますよ。


- GPT-4oの解答

比較のため、4oモデルに解かせてみます。

全然違う。

2問とも不正解でした。


- GPT o1の解答


o1はそこそこ時間をかけて検証と計算を進めていき、すごく長いプロセスと共に答えを出してきました。

途中は割愛します

こちらは1問目は正解!2問目は残念ながら不正解でした。
ちなみに自分は……、自分も1問目のみ正解でした(._.)


o1の頭の中を覗いてみる


o1の出した解答の左上、"思考時間"の部分を押すと、o1がどのようなプロセスで回答を導き出したか確認することができます。


また、解答の中で気になったのがこの一言。

step by step.


よくプロンプトの中に「ステップバイステップで考えて」と添えると、AIは論理的に考えて処理してくれると言われますが、

このモデルはこっちが何も言わなくても、自らステップバイステップで思考するように訓練されているようです。感心感心。


まとめ


ChatGPTの新モデル、o1を使ってみました。これまであまり計算とか得意でなかったGPTが、論理的な思考に強くなったのは嬉しいニュースです。

また活用の幅が広がったなと思いますし、これからまたファイルの添付など他の機能も搭載されたらさらに強いモデルになりそうだなと期待が膨らみますね。


お読みいただきありがとうございました!

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?