見出し画像

OpenAI-o1に的確に動いてもらうには、最初から丸投げしない

OpenAIのQ*だとかStrawberryだとか言われていた超賢いモデル(おそらくはフレームワークのほうが発明?)のo1が公開されました。これは現状まんべんなく対応できるpreview版、数学、工学に特化したmini版の二つが公開されており、完全に実装されたわけではありません。

そこで皆さんもやきもきしていることだと思うのが、「画像、ファイルが遅れない」ということです。

今回の記事では完全実装ではないo1をそれなりに賢く使う方法を紹介できたらと思います。


一応実証公開なので、機能が不完全

画像が送れない、というのは非常に致命的です。(個人的には)
文字に起こすのも面倒なうえ、伝えるべきだったことが伝えられておらず、また書き直して再生成…というのは非常に面倒です。
o1では推論時間が「超」長いので、プロンプトの精度はさらにネックになります。ただ、うまくいくときは信じられないほど賢い答えを出します。

個人的に対応している方法は、「最初はGPT-4oに聞く、そのあとにo1に聞く」という方法です。

GPT-4oで解決しないことをo1に聞く

この手法はなかなかに効果的です。基本で使うのはGPT-4oで、画像やファイルをバンバンに送りまくりながら進め、「あ、このエラーは4oじゃ無理だな」というものにぶつかったとき、
o1に「実現したい仕様、コード、エラー、追加であれば命令」を送ります。
これはかなり効果的で、o1は論理的思考力を付けるために作られたものと、公式で言われているように、エラーとコード、仕様の因果や関連を非常にうまくくみ取ってくれます。

「プログラミングは論理的思考力や!だからみんなでアルゴリズムを勉強しようね!さあ、僕の作ったこの教材で君もトップエンジニア!」といっているような怪しい三流プログラマとは違い、
実現したいものが実現できているか、どこの部分がエラーや仕様の実現にどう影響しているのかなど、読み解く力こそがプログラムに必要な論理的思考です。
o1はこれに「非常に」強いです。

ただ、o1には欠点があります。
推論時間がめちゃめちゃめちゃめちゃ長いというのもありますが、それよりも、「頑固おやじみたいな出力」です。
4oやCluadeには接しやすさみたいなものが意識され、チューニングされているといいますが、o1は基本的に聞いたことしか答えてくれませんし、コードを生成させてもコピペしやすいように全文を表示したりすることも毎回してくれるわけではありません。
しかも「全文表示して」というとまたまたクソ長い推論が始まります。もちろんこういう簡単なタスクは早いほうですが、4oと比べると非常に長いです。

あとは、簡潔すぎて不愛想に見えるのもあります。もちろん会話用に作られたモデル(システム?)ではないので、当たり前ではありますが。

イメージとしては、GPT-4oは「隣の席の人」で、o1は「忙しそうだからずっと拘束はできないけど、問題をすぐ解決できるスゴイ専門家の人」でしょうか。そこまで使うハードルは高くはないか…

使い勝手を知るために

o1は受験数学レベルも解ける!など非常に高性能なことがわかっていますが、その一方で、「受験数学なんか覚えてねーよ」となってしまえばベンチマークは不可能です。私のように、受験数学が受験の時しか覚えていなかった人間にはこういう高度なタスクはうまくいっているのか実感しづらいです。

OpenAIが少し前に出した論文で、人間を超えたときにベンチマークするにはどうすればいいか、みたいな話がありました。
大雑把にまとめれば、それによるとAG(S)Iが出力した内容をかみ砕いて説明するように指示すれば人間のような愚鈍な存在でもわかる。
ということでした。

4oは知能としては大体賢いほうの高校生くらい、といわれていましたが、o1はだいぶレベルが上がったと思います。人類の半分はおろか6~7割以上は抜かれたのではないでしょうか。このような賢すぎるシステムと直接対話できることはもちろん目指すべきですが、わからない場合は、4oなど人間に寄り添ってくれるモデルを使ってかみ砕いて説明してもらうこともいい方法かもしれません。

今までの歴史においては、圧倒的トップに賢い人間のみが先導し、それ以外は全く持って置いて行かれ、「世界を変えるのは一握りのエリートだけ(byパプテマス・シロッコ)」でしたが、AIにおいては、いずれ彼らも抜かれます。
ただ、彼ら以外の人間は、彼らよりも圧倒的に早くシンギュラリティを迎えることになるので、早い段階で自分を超えたシステムをどう使うか、ということを多少の悔しさをもちながらも習得することになります。
まぁ、何が言いたいかというと、「大抵の人は知能が抜かれただろうけど、自分より賢い人がいるってのは今に始まったことがないんだからコンピュータに抜かれたくらいでくよくよするな!いちいち天才高校生とかに対抗心持たないでしょ」ということです。

いいなと思ったら応援しよう!