OpenAI(ChatGPT)のo1モデルを使ってみた感想
2024年12月に、OpenAIが次々と新機能を発表するとのことで。
今日は、その一番槍として発表されたo1モデルの使用感なんぞ書いてみたいと思います。
o1モデルとは?
o1モデルとは、人間のように考えるプロセスを取り入れた推論モデルとのことです。
数学とかプログラミングとかの性能が特に向上しているとのこと。だからよく、東大入試の数学とか解かせてるデモがありますね。
これに対してGPT-4oとは、テキストの予測に基づいて応答しているだけでなのです。考えている風に見えるけど、実は「こう聞かれたらこう答える!」という脊髄反射的な感じなのですね。まぁそれでも十分に凄いけど。
o1に作業をさせてみた
課題
データ化していない紙の商品カタログ(スキャン済み)から、
商品名
品番
価格
などを抽出できるかを試してみました。ちょうど、そういう仕事があったので(笑)
もちろん「o1の用途とは違う!」のは重々承知なんですが、『推論』の先には『作業』や『行動』があると思うので、なので現段階でどのくらい仕事の実作業に使えるかを試してみた次第です。
ちなみに、紙からデータ化するなら「OCRでいいのでは?」と思うなかれなのです。商品カタログみたいなデザインが入ってしまうと、OCRはなかなか機能しません。だから細かくOCRの範囲指定をしなければならなくなり、「これならタイピングしたほうが早ぇ!」となります(笑)
さらに今回は、対象商品に手書きで赤丸が書き込まれていたり、手書きで注釈が入っていたりと、紙面デザインまで含めるとかなり雑多な状態です。
もちろん人間なら、天然の推論能力を活かして、「どの商品情報が必要で不要か」はすぐ分かるわけですが……果たして人間と同じ判断ができるのか!?
結果
赤丸が付いている商品の認識は出来るも、文字起こしが出来ず。
どうも、日本語が弱いみたいですね。アルファベットと数字は出来たのですが。
とはいえ赤丸が付いている商品を認識できているのは凄いと思いました。
そこで依頼内容(プロンプト)をちょっと変えてみました。
課題変更
「もっと読みやすい紙面でなら出来るのでは?」と思って、手書き文字が入っていないデジタルカタログの紙面をキャプチャしてo1に投げてみました。
ただこうすると、『手書き赤丸注釈入りカタログ』と『デジタルカタログ』とを付き合わせて考えることになるので、さらに高度な感じになりそうですが……
なお現段階ではPDFをo1に投げることは出来ないようなので、デジタルカタログですが画像化しています。
結果
前回とほぼ同じ結果。つまり文字起こしが出来ず。
o1は「付き合わせて考えてる」と言ってるんですが、出力結果がほぼ同じなので、付き合わせていない可能性あり(笑)
いずれにしても出来ませんでした。残念。
費用対効果は?
これで月3万円であれば……パートさんにお願いしたようがいいですね。
いくら東大入試が解けても、実作業が出来ないようでは「月3万円は高すぎる!」と思いました。
でも実作業が出来るようになったら「月3万円では安すぎる!」となるでしょうね。なぜなら人間全員が失業してしまうから!!
マーケティング施策を考えさせてみた
課題
o1は推論がお得意ということで、マーケティング施策を考えさせてみました。
ずばり「どうすれば人気小説になるのか!?」(笑)
ただ漠然とした質問をしても漠然とした答えにしかならないので、個別具体的に次の質問をしました。
「小説投稿サイト『カクヨム』で、どうすればランキングがあがるのか?」
noteでも投稿している小説が、なにげに先月、ジャンル別日間で89位まで上がっていたので、だからカクヨムのランキング・アルゴリズムについては分かってきた事がいろいろあって、それら予想やデータもo1に突っ込んでみました。
つまり人間のぼくが考えたすべての推論を与えた状態で、ぼくを超える推論は出来るのか!?
思いも寄らぬ裏技や近道を大いに期待!
結論
お話になりませんでした(^^;
やれSNSを使えだの、やれ小説冒頭を変えろだの、やれ人気作の真似をしろだの、「そんなんすべてやっとるわ!」という回答ばかりでした。
まぁアレですね。答えのない答え──つまり実現不可能なことを可能にする施策を求めたところで、回答できるはずがないってことですね。
どうやら人気小説になるための裏技や近道はないようです(笑)
プログラムを書かせてみた
課題
Photoshopにちょっとした自動作業をさせたかったので、JavaScriptをいくつか書いたのですが、その一つが上手く動作しませんでして。
GPT4oでもClaudeでもGeminiでも駄目だったので「やむを得ない、ここは手作業でするか……」と諦めていたんです。
徹底的にデバッグすれば出来なくはないと思うのですが、そこまで時間を掛けるほどの作業でもなかったので。
これをo1に修正させてみました。
結論
出来た!
さすが、プログラミングに長けていると謳われているo1。本業は見事にやってくれました。
それでも2回くらい修正させる必要はありましたが、他のAIでは出来ませんでしたからね。さすがです。
まとめ:月3万円、払うべきか?
と、いふことで。
ぼくの仕事でお願い出来そうなのはプログラミングということなのですが……
でも、ほとんどのプログラミングは月3000円のClaudeで間に合ってしまうからなぁ。
プログラミングだけだと、月3万円はあまりに高いと感じますねぇ。
あるいは、ゴリゴリにプログラミングしなければならないときのみ3万円プランにするとか。そういうときは忙しいわけですから、案件の報酬で吸収できるわけですし。
やっぱり、AI自身がガンガンに作業できるようになるまでお預けかな。そうなったら月30万円でもいいですが……AIにお願いする前に失業しそう……(^^;
追伸
自作小説7万文字をo1に投げて「褒め称えて!」と依頼したら……時間を掛けて考えるモデルなのに……1秒で返事してきやがりました!!