見出し画像

ChatGPT『o1』は『4o』の上位互換ではなく"補助機能"にすぎない!

超概要

  • "12 Days of OpenAI - DAY1"(2024年12月) にて、ChatGPT全ユーザーを対象に推論に優れた新モデル『o1』が利用開放された

  • ただしこのモデルは優秀であるものの『4o』にとって代わるものではないと公式が位置付けているらしいことも、後日(DAY4)判明した

とかいう、「生成AIニュース最前線」的な記事です。
(従来の筆者記事でまったく扱ってないカテゴリですけど、まあたまにはこんなものも、ということで)




前提: 『o1』の優秀性

"推論に優れた"とはどういったことなのか、本題じゃないのでざっくり表現だけします。

  1. 数学、科学系の問題解決やプログラミング領域に特に優れる

  2. 公開されてたpreview版よりも全要素で性能向上

  3. 回数制限はあるが無料ユーザーも使用可

ありきたりすぎる言い回しだけど、"優秀な理系"イメージがすごい。
一方で"文系"なタスクだとダメダメなのかというと、たとえば小説創作を試したけどむしろ全然いい感じ、みたいなレビューすらぽつぽつみかけます。

ChatGPTで直近で使われていたのは『4o』モデルなわけですが、こう列挙されちゃうと切り替え不可避って感じですよね。唯一問題になりそうなのは3の回数制限だけ、ということでChatGPT利用の際には

常時『o1』優先 → リミットに引っかかったら『4o』移行してお茶濁すかリアル時間待機
(それが嫌なお金持ちは月額200ドル契約して使い放題だ!)

というのが全タスクの最適解に思えてきてしまいますね!
……実際そうではない、というのが記事タイトルでネタバレしとることなのですけど、まずは『o1』の使い方を確認しておきましょう。


『o1』の利用方式2種

ChatGPTで『o1』モデルを利用する方法は2通りです。正直どっちも説明するまでもない簡単なものですが、この後の話の展開の都合で、画像付きで解説いたします。(あくまで12月12日現在・ウェブブラウザ版仕様です)

①『モデル選択』方式

画面左上のセレクターから『o1』を選ぶ。以上!



②『ツール選択』方式

会話窓の下部に『ツール』なるものが新設されました。(DAY4発表後に急に生えてきた概念です)
下の画像でいうと、元々ファイル添付用のクリップとウェブ検索のための地球儀(画像ではちょうど隠れてる)2つのアイコンがありましたが、正にその間に追加されてる道具箱のやつですね。



でそれをクリックすると以下の画像のようになりますから、もちろん『理由-o1 を使用する』という項目を選びましょう。



するってえと以下のように会話窓の中に青字が表示されますからそれに続けて皆さんの聞きたい内容を打ち込んでくださいなぜ笑点の司会者みたいな口調なんだろう



いずれの方法も会話冒頭なら確実に『o1』利用可能ですし、『o4』なりと既に会話しているセッションであっても"条件を満たしていれば"任意に切り替え可能です……。


実例: 『o1』が使えないパターン

"条件を満たしていれば"と見るからに思わせぶりに書きましたけど、具体的にどういうことでしょうか?

筆者の以前記事で扱った、内容はともかく形式的にはなんの特筆事項もない『4o』とのセッション末尾で『o1』への切り替えを試みます。


はいこれは『o1』へ切り替え可能、つまり"条件を満たしている"例です。

では次、これも記事化してる"AIフーダニット"セッションの最後で同じことを試してみましょう。


ん?『ツール』内選択肢から肝心の『理由-o1 を使用する』が消えてる。

ならば左上のセレクターから『o1』を選びましょか……


『このモデルはファイル添付をサポートしていません。』

と、はっきり断られてしまいました!

このセッションでは「推理小説の犯人当て」を目的としていたためテキストファイルを既に何回か添付済み、でもそれだと『o1』には切り替えられないよーと言われてるようです(ただし「ファイル添付との併用が完全に不可能」というわけではない、ややこしいので後述)

次の画像もダメな例ですが、原因は何でしょうか?


『このモデルはターゲットを指定した回答をサポートしていません。』

この表現だとなんのこっちゃですが、ずばり「セッション内でウェブ検索を実行してるから今さら"o1モデル"には変更できないよ」です。(ちなみにこれは『ChatGPTに時事クイズを出す』という趣旨のセッションで、多分どなたにとってもめちゃめちゃ面白いので記事化したものを是非あとでよんでください!)

ともあれ、次でダメなパターン3つ目。



『このモデルはキャンバスをサポートしていません。』

これは特にまだ記事化してないやつですけど『当時有料ユーザー用だった"キャンバス"モードの初使用時』の奴でして、もちろん以降のやりとりでそれを活用してます。
ともかくo1はキャンバスとも併用不可というのも判明。


ほぼ正しいはずの私見

ではここで"o1選択可能時の『ツール』"がどういう塩梅で表示されていたか、再確認してみましょう。


『これら4項目は"選択肢"であって同時使用はできない』という仕様と解釈すると、めちゃめちゃ腑に落ちませんか?
ウェブ検索・キャンバス作成に関して正にそうだったのはここまでの画像で実証済み、画像生成(DALL-E)は試してないがまぁ想像に難くないのでていうか"ダリ"は根っ子のアホアホ部分がフロント(ChatGPT)と連動してないのが最大の問題ゆえ仮にそこだけo1に切り替え可能でも何の意味もないしね

一方で『ファイル添付』は先ほどの画像だと併用不可だったものの、まっさらのセッションでo1モードで始めれば添付できるのは確認済みです。
まぁその仕様じゃないと"難しい論文の解釈やれる"みたいな触れ込みが羊頭狗肉すぎて、さすがに僕が触れるまでもなく大騒ぎだったでしょうが。
ただ最初の例みたく4oモデルでファイル添付をやった後にo1切り替えはダメという、何がしか微妙な問題を孕んでるようです。

更に現時点ではまともに追試してませんが、メモリーを読めない疑惑も『o1』にはあります(前記事参照)


『o1』併用不可機能まとめ

まとめると現時点で『o1』と確実に併用できないのは以下3つ

①ウェブ検索
②キャンバス機能
③画像生成

また併用に注意を要するのが以下2つ

④ファイル添付
⑤メモリー機能

さて、①って特に激痛のユーザー多いんじゃないでしょうか?
"o1使ってみた"な記事でシラっとその要素触れつつo1性能を激賞してる方とかいたりしますけど(4oで最新検索した結果をo1に貼り付けて~みたいな)、ほんとにそれでだいじょぶそ?と小一時間問いただしてみたいところです。
いうて僕はあまりウェブ検索に重きおかないけど、最新ニュースをChatGPTに流し込んでクソみたいなnote記事量産なさってる用途の人らがそんな致命的な仕様目の当たりにしてなんですっとぼけてんのー?という……。

②も結構な損失です。キャンバスは今まで有料ユーザー限定でしたし、何しろ対抗馬のClaude"アーティファクト"が強力だったせいで地味めな存在でしたけど、DAY4でGPTsでも利用可能になったのがめちゃくちゃヤバい!
キャンバス自体はこの度無料でも使えるようになったもののGPTs作成は相変わらず有料ユーザーの特権なので、むしろ課金価値が余計に出てきたまである、と筆者的には感じてます。そういった詳細記事も近々書きたいですね!なんでこんなネガティブ内容のを優先してんだよ
……まぁともかく「キャンバス」もブログ執筆作業などに直結してますから、『o1』に拘泥するよりはむしろ円滑にその恩恵に与りたい、ってユーザーは確実に一定数いるでしょう、と。


結論①: 実は『o1』は"新モデル"ではない

ここで記事のタイトルに立ち返って、o1は4oの"補助機能"にすぎないという見立てを僕は強調させていただきます。

というのは、今までChatGPTユーザーは当然に4oを使う上で必要に応じて「ウェブ検索」をさせたり「画像生成」をさせたりしてましたよね?
ここ数日でOpenAIが行ったのは、あくまでソレらと同次元に「理由」なる推論特化アクションを新設しその名称を『o1』とした、ってだけのことです!(で同時に「キャンバス」もその範疇にした、という)

まぁけっこうな詭弁に思われるかもですけど、ともかく公式に『ツール』直下に明確に4項目が並べられてる・その内の一が『o1』、って現実がある以上、自分は全く牽強付会とは思ってないです。
ただそれはDAY4の「キャンバス」本格実装時に初めてそういう面構えになったわけで、しかし今まではpreview版なりでo1の"モデル"側面が強調されてがために「4oの進化先?」ってまず認識されるのも、やむない気もします。

ただそれは、ChatGPTの現実的な用途においては大いなる誤解である!
実際、ど初っ端から論文添付して解析させるとか、ある程度の条件与えて短編小説書かせるとか、そういう明確かつ単純用途としては『o1』の性能をぜひフル活用するといいと思います。(この場合の「単純」はもちろん扱う中身の質ではなくて行為自体のこと、念のため)
がそれぞれその先に、例えばウェブ最新情報を読み込ませたり長文執筆させたり、そういう複合的タスクを念頭においている場合は絶対に『o1』でセッションを始めてはいけません!

……でありますから『o1と4oを比較したら前者の生成文章が圧倒!』的な記事を安直に執筆してる方けっこういらっしゃって、DAY1段階の執筆ならしゃあないとしてDAY4以降でもそんな表現してるのが判明しようもんなら、
「ぜんぜん別次元のo1と4oを"比較"って、おかしくね?
おかしくねーって言い張りたいならDALL-Eと4oを同様に"比較"した上で『画像生成力で前者の圧勝!』みたいな記事、書けるもんなら書いてみ?
」とか僕からインターネット・ヤカラ絡みされかねないので、ほんとうに気を付けてくださいね!


結論②: "母艦"は変わらず『4o』である

……実は僕はここまでの記事で明白なウソを書いてまして、それは、
『これら4項目は"選択肢"であって同時使用はできない』
という記述です。(めっちゃ核心部でウソついてんじゃねーよ!とつっこまれそうですけどワケがあるのでもうちょっと読み進めてください)

ともかくこの書き方だと、
『4項目(o1 / web検索 / キャンバス / DALL-E)はいずれも組み合わせ不可』って当然、皆さん読まれますよね?

そうではなくて正しくは
『"排他的"なのはo1のみ、後3つは4oセッションなら当然に共存できる』
つまり先ほど"o1だと使えなくてイタい"的な表現をした2機能が4oならば何の気兼ねもなく使えるということです!DALL-Eはどうでもいいとして
なのでさっきはなぜウソを書いたかというと、まずは4oの美点の方ではなく
"o1を絶対視することの弊害"を単純にクローズアップしたかった、という方便でした。

ともかく項目タイトルとして書いてるように"母艦"としては4oは相変わらずファーストチョイス、どころか無料ユーザーでもキャンバスが"発着"できるようになった点からしてむしろ重要度が増した、と僕は主張したい!
o1は"必要に応じて"脇で個別セッションする運用が丸いと思われます。
(本当に念のためですが、あくまで2024年12月12日時点の見解です)


後書き!

冒頭に書いたとおり普段はこういう『最新AI最新情報』的な記事は書いてない人間なのですけど、本件についてはあまりにもそっち系の既存記事が内実(o1の各種併用不可仕様)に触れてなさすぎにつきクチバシを挟まざるを得ませんでした。
そういう領域こそはnoteで小銭稼ぎしたい向きがしっかりこなせばいいんであって自分のAIと戯れてるのを見せびらかすような記事しか書きたくない僕がそれにタッチするのはLOSE-LOSEでしかないんですから、ここまで読んで心当たりがあるようなnoterは本当に猛省していただきたいですね!

じゃあ普段どんな記事書いてるかというと、さっき本文中でもリンク張りましたけど以下のものが圧倒的に一押しですね。

こんな感じの取り組みを面白いと思ってくれた方は、ぜひフォローお願いします!(今回みたいな最新情報記事はあまり期待しないで)

いいなと思ったら応援しよう!

GPTコミュニケーター・シバネ
"エルラ"への応援チップはこちらにおねがいします!