Open AI o1 Pro使ってみた

KATSU

2024年12月14日 23:30

GPTの名前が取れたOpen AIのo1ですが、優秀・・・即Claudeから乗り換えちゃいました。

o1-preview触ったときは中々返答ないし、コードとかもClaudeの方とあまり変わらないなーと思ってたんですが、o1になると高速レスポンスな上に回答がかなり正確なので乗り換え確定しました。

ただ、１週間で50回しか使えないのがネックなんですよね～使い込むと気付けば回数オーバーになっちゃうのが難点。

ここまで使い勝手がいいならo1 Proもどうせなら使ってみようということで３万課金してみましたｗ
課金する前にperplexityとClaude等のサブスク更新を止めて、お試し１か月やってみようかなという感じです。

Chain of Thought？

o1はChain of Thoughtといわれる推論に強いモデルです。
Chain of Thoughtといわれるとよくわからないですが、思考過程を指します。

例えば、以下のような問題とCoTを一緒にプロンプトしてあげます。

問題例：
「アリスは最初にリンゴを5個持っていました。
彼女はそのうち2個をボブにあげました。
その後、キャロルから新たに3個のリンゴを受け取りました。
最終的にアリスは何個のリンゴを持っていますか？」

CoT（思考過程）の例：問題の確認：
最初にアリスはリンゴを5個所持。
変化1：2個をボブにあげる
5個あったうち2個をあげるので、アリスが手元に残しているのは「5 - 2 = 3個」。
変化2：キャロルから3個受け取る
3個持っている状態に3個追加されたので、最終的には「3 + 3 = 6個」になる。
結論：
最終的にアリスは6個のリンゴを持っている。

回答：6個

Open Ai O1-Pro

プロンプトで思考過程、解き方を学習させているので、この後に、新しい登場人物と数値を変えたような問題を出すと正解率が高まるというものです。

o1の場合は、プロンプトで記載しなくても、思考過程も強化されたモデルなんですよね。

すると、どんなことがいいと思います？

そう、思考過程を学習しているということは、論理的に考えてくれる。
つまりは、前提や仮定とかこちらが伝え漏れている情報とかも勝手に補ってくれたり、理解した上で想定となる値で結論を出してくれたりするんですよ。

これがコードとか作ってる時に効いてきますよね！

ClaudeとかCoTが弱いモデルでコードを作ってると、私の要件定義が甘い為に出た前提の抜け漏れや、Claude自身が前提忘れてちゃうと、作りたいコード作るまでめちゃくちゃ時間かかるんですよ。

それが・・・O1にするとあら不思議・・・前提説明抜けてるところはコメントでここについては推定とか仮定とか補ってくれるんですね！

あー忘れてたーと思ったら再度ここはこうやってとこちらから再度指示するだけで済むんですよ。

今までは、この抜けてた前提と、Claudeが途中から忘れ去った前提で作業効率落ちてたんですが、o1になるとこれがほぼなくなった感触があります。
まだそんなには使ってないですが、前提や仮定を意識した回答してきてくれているのは回答からすごく伝わってきますね。

コードに強いといわれるのは、CoTが関係してると思います。

難題をぶつけてみると？

さて、さらに数学にも強いらしいので、難題をぶつけてみることに。

https://ja.wikipedia.org/wiki/%E6%95%B0%E5%AD%A6%E4%B8%8A%E3%81%AE%E6%9C%AA%E8%A7%A3%E6%B1%BA%E5%95%8F%E9%A1%8C

難しいで検索してると数学の未解決問題とかあったのでこれを解いてと無茶ぶりしてみましたｗ

未解決だから知らんがなといわれたので頑張ってもらうことにｗ

もはや何を言ってるかさっぱりわかりません・・・
折角なので大まかなイメージを教えてもらうことに。

ほーなるほど、素数の並び方を正確に説明できる問題なのか！

GPT4oだとどうなるのかなと思って確認。

あまり変わらないような？という気もしますが、o1 Proの方が最初に問題設定をしていたり、既存情報からどこまで解決できているかという現状の解決できているところまでの過程と今後のアクション記載があるように見えます。
GPTの場合は、背景や前提についてはあまり触れずに単純に問題を解く上での話をしているように見えました。

どちらも結論は同じようなまとめになるんですが、思考過程で必要な前提や背景情報とかはo1 Proの方が意識されているように見えました。

ついでに、o1も観てみることに。

o1の方はあまり考えずに、回答してきました。
ただ、文字の出力はちょっとゆっくりめな感じでした。

o1だとイメージですが、推論の型で１回程度考えて回答してきているような感じかなぁというものでした。
o1 proだと推論の型で何回か過程を回してサマリーなのか、回答内容に矛盾がないのか確認しているようなイメージですね。

多分ですが、o1 proだと最初に持ってこられた資料をチェックした？こういう内容考えた？とかいって３回目に見るようなイメージなんでしょうね。
その分計算リソースは使うと思いますが、答えが欲しい自分からするとありがたいですよね。

Soraや高度な音声モードもPlusよりも使える幅アップ

Proをお試ししようと思ったのが、o1 Proの無制限利用と合わせて、Soraや高度な音声モードもPlusの契約よりもさらに使えるところですよね。

Soraは今年の２～３月ぐらいに発表のあったOpen AIの動画生成AIです。
動画生成AIはあんまり使ったことないんですが、SoraがSora上で画像を生成している動画を生成してもらいましたｗ

そのあと、Soraが自動的にプロンプトを変えて添付のような動画できました。
中々すごい・・・

作るのは２～３分かかってました。

見える、私にも敵が見えるぞ！

Gemini 2.0で試そうと思ったらスマホ側のGPTで自分の画面共有したりカメラ通して画面見ながら会話ができるようになってました！

進化が止まらずですが、冬休み前の成果として一気に出してきた感じですねｗ

とはいえ、この画面共有モードと高度な音声モードも使ってみたらめちゃ便利です。

ふと疑問に思ったことを風呂場で聞いてみるとずっと教えてくれるんですよね。

私自身、書いて覚えるよりも、人に喋ったりアウトプットして覚える方が記憶に残るんですが、GPTから教えてもらったものを自分の言葉で説明して認識合う？とか会話してるとちゃんと答えてくれるので。
結構面白い・・・これははまりそう。

レスポンスが早いんですよね・・・これが凄い。

ということで、どんどん便利になっていくAIを使うの面白いんで皆さんも使ってみてはどうでしょうか。
しばらく飽きなくて済みそうですｗ

ここから先は

0字

このマガジンがお得な理由・過去のSegment Routingに関する有料記事をすべて公開！（2024/8 現在300記事以上）・新規に記載するSR関連記事もすべて公開！・関連する技術ネタも公開！(※) ※関連する技術ネタは、その月に加入した人だけ定期購読料で閲覧可能ですので、購読期間が長ければ長いほどお得になります。

Segment Routing

¥600 / 月

このマガジンは主にSegment Routingについて書いています。 Segment Routingがよく分からんけど仕事で使うという…

ログイン

この記事が気に入ったらチップで応援してみませんか？