1ヶ月のお小遣い3万円をChatGPT Proのo1 pro modeに課金した話
2024年12月5日、OpenAIから新プランの「ChatGPT Pro」が月額$200(約3万円)でリリースされましたね。私は2022年にリリースされたChatGPT3.5に衝撃を受け、AI事業を生業とする今の会社に転職した程のAI好き。これまでもChatGPT Plusはもちろん、Gemini、Claude、Mapifyなど、数々の生成AIツールに課金をし、その魅力を体感してきました。
OpenAIの発表によると、o1 proについては推論レベルが向上し、数学とプログラミングが博士レベルでの生成が可能になったとのこと。もちろん、私の業務では当然持て余すレベルではあるのだが、やっぱりその凄さを自分の肌で感じたい!
ということで、今回はそんな最先端のテクノロジーにお小遣い全額をぶち込んでみたので、その凄さを皆さんにも共有させて頂きます!
o1 proとは?概要と進化したポイント
この記事を読んでいる人の多くはすでにo1 proについてはインプット済みの人が多いかと思いますが、改めて概要をおさらいしていきます。
少し回りくどいかもしれませんが、o1 proの性能を正しくお伝えするために、OpenAIが発表した「Introducing ChatGPT Pro」に掲載されているグラフについて、一つずつ解説していきたいと思います。
まず、上の段の3つのグラフについては「o1 pro mode」がこれまでの「o1 preview」、「o1」と比較してのどれだけ基本性能が優れているかを表した表になります。
Competition Math (AIME 2024)は数学競技における正答率。
Competition Code (Codeforces)はプログラミング競技における正答率。
PhD-Level Science Questions (GPQA Diamond)は博士課程レベルの科学問題への回答正確性を評価したものです。
どれも過去のモデルと比較しても基本性能が優れていることがわかります。
そして、今回のo1 pro modeの素晴らしさを表しているのが下の段のグラフになります。こちらも上段と同様に左から数学、プログラミング、博士問題の順で正答率を表してるのですが、それぞれの問題を4回連続で正当した割合を比較したものになります。
下部のグラフでは「o1 pro mode」が「o1 preview」、「o1」と比較して、推論レベルが飛躍していることがわかります。
ChatGPT Pro(o1 pro mode)をポチってしまった理由
ChatGPT Proプランは月額$200で、日本円に直すと約3万円になる。
年間で利用したら36万、、、、
痛い。
痛すぎる。。。
いくらAI好きでも年間で36万となると流石に使い続けるのは厳しい金額になってくる。
もはやオタク。
推し活の域に入っていると言えよう。
それでも私が今回思いっきって月額3万もするProプランに課金したのには明確な理由がある。
それは、「o1 pro mode」の凄さを自分の肌で体感したかったからである!
「AI活用を生業とするものとしては、自分の言葉で語れる方が良い」などそれっぽい理屈も浮かんだが、やっぱりシンプルに最先端のテクノロジーを体験したかったというのが一番大きな利用である。
きっと、一時の課金ではなく、長くChatGPT Proプランを利用する人は同じような類の人間なんだと思う。
それっぽい理屈を並べて課金しても、並の神経では年間36万は払えないだろう。むしろ1ヶ月だけのお試しでなかなか勇気の必要な決断だと思う。
読者の皆さんの中に同じようにChatGPT Proプランをポチった人はきっと仲良くなれると思うのでぜひ、フォローお願いします!w
お小遣い全ぶっこみした価値はあったのか?o1 pro modeを体感してみて
いろいろ前置きが長くなりましたが、皆さんが一番知りたいのは「実際どうなの?」という生の声だと思うので、ここらかは少し真面目に書いて行きたいと思います。
改めてo1 pro modeについて
前項で述べた通り、OpenAIの発表ではo1 pro modeは「数学」「プログラミング」「博士レベルの問題」において性能が向上している。
私はコンサルタントなので、業務で数学の問題を解くこともないし、プログラミングを行うこともない。ましてや博士レベルの問題を解くなど、どんなに暇でも行うことはない。
しかし、ここで「推論能力」の向上が何をもたらすかを、数学や博士問題を解く必要がない私のようなユーザー目線で考えてみたいと思います。
「推論」とは、モデル(AI)が入力情報をもとに筋道だった結論や答えを導き出す力のことを指します。これを日常的なビジネス課題に置き換えて考えてみると、必ずしも高度な数学やプログラミング問題、博士レベルの科学問題を扱わなくとも、優れた推論能力は幅広い場面で恩恵をもたらしてくれることが分かります。
推論能力がビジネスに活きるポイント
複雑な情報整理・要約:
日々の業務では、膨大な情報やデータを短時間で整理・分析し、その結果を要約する必要があることが多々あります。モデルの推論能力が高ければ、「複雑なメール文面をビジネスパートナー向けに簡潔にまとめてほしい」「複数のレポートを分析し、重要なポイントと提案方針を抽出してほしい」といったタスクで、的確な要約・構造化を行うことが可能になります。曖昧な要求への柔軟対応:
「この市場環境下で新規製品の販売戦略を検討したいけれど、まずは競合状況を整理し、顧客ニーズを抽出して短期・中期的な施策をまとめてほしい」といった、抽象度の高い相談を投げかけても、高い推論能力があればモデルは複数の要素(市場動向、顧客特性、競合戦略、内部リソース等)を総合的に考慮し、それらを関連づけて回答を生成できます。これは、漠然とした要求を段階的にブレークダウンし、具体的なインサイトやアクションプランに結びつける過程で極めて有用です。非定型業務への対応力強化:
多くのビジネス現場では、定型的な業務(請求書の作成、メール返信のテンプレ化など)は自動化しやすい一方で、非定型的な問題(新しいプロジェクトへの対応策検討、リスク評価、突発的なクライアント要望への即時対応など)は人間の判断が求められていました。しかし、推論能力が高いモデルは、これまで「人間ならでは」とされてきた判断プロセスに近づくことができ、「どうすればこの新規提案をより有利な条件でクライアントに提示できるか」といった、人間が頭を悩ませる問題に対しても有益なヒントを示せる可能性が高まります。専門外領域へのブリッジ:
コンサルタント業務でも、顧客のビジネスが拡大・変化すれば、自分の専門外となる領域(たとえば新技術領域、異業種への進出、学術的なバックグラウンドが必要な分野)について概要を速やかに把握し、アクションアイテムを抽出する必要が生じます。高い推論能力を持つモデルは、未知の領域であっても関連する知識を統合し、「この業界では何が成功要因となるのか」「この新技術を導入する際のリスクと期待効果は何か」といった問いに対して、一定の道筋を示すことができます。
o1 pro modeで生成されたアウトプット例
理屈はともあれ、実際にどのようなアウトプットが生成されるのか、私が試した一部のユースケースを皆さんにも紹介したいと思います。
複雑な情報整理・要約:
今回はCornell Universityに掲載されている『An Embedding Learning Framework for Numerical Features in CTR Prediction(広告のクリック率(Click-Thorough Rate: CTR)予測の新たなモデルであるAutoDisを提案)』という論文の翻訳を含む要約をさせてみた。(引用:https://arxiv.org/abs/2012.08986)
余談ではあるが、現在o1 pro modeで添付できるファイルは画像ファイルのみなので、引用元のテキストを拝借してインプットさせてもらった。
結果としては54,500文字程度の論文を約1/3の2,000文字程度で要約してくれた。また、『背景および課題』『提案手法』『性能比較』『従来手法との比較による優位点』『実運用での成果』『まとめ』と各センテンスに見出しを振ってくれ、要点の掴みやすい文章としてまとめてくれた。
曖昧な要求への柔軟対応:
曖昧な要求としては生成AIのリテラシーを図るためのアセスメントテストの内容を考えてもらった。
余談ではあるが、o1 pro modeではキャプチャのようにプロンプトを投げてからChatGPTが考える時間がかなり設けられており、感覚としては2~3分程、回答までに時間を要する。
もちろん、その分内容も良く、しっかり考えて回答してくれているのだろうと感じることができる。
話を戻してアウトプットされた結果を見ていこう。今回はアウトプットの量が多いので、冒頭とおしりの部分のみキャプチャを掲載。
まずは冒頭でどのような観点でアセスメントを作ったのかをしっかりと提示してくれている。
また、「MECEに分解し〜」という文言は、私が独自にChatGPTのパーソナライズ設定でカスタマイズとして出している指示から拾ってくれており、これまでよりもパーソナライズ設定に忠実に動いてくれていると実感できた。
そして、肝心のアセスメントの内容についても各領域別に数問ずつ問題を作ってくているのがわかる。
最後に想定される活用目的についても提示してくれるので、自分がどんな目的でアセスメントを使う予定だったのか考えるきっかけをくれ、自身の想定目的とずれていればより目的に適した内容に修正できるよう確認してくれている。
従来のGPT-4o、o1と比較して感じたこと
従来のモデルと比較して感じたことについては下記の通りである。
パーソナライズ設定の内容により忠実に
結果だけをアウトプットするのではなく、思考の過程も含めて提示
わかりやすく情報整理されたアウトプット
全体を通して言えることとしては、これまでよりも利用ユーザーの意図や指示をしっかりと汲み取り、より最適化されたアウトプットを生成してくれると言えるのではないだろうか。
従来のGPT-4oやo1の場合、出てきた結果としてはある程度ユーザー側でも考えつくであろう当たり障りない回答が多かったが、今回のo1 pro modeではより深い思考を凝らして考えられた感のあるアウトプットを生成してくれている。
私は過去にこのようなフィードバックを受ける体験を何回かしている。
それは、現職のキレッキレ上司からもらうフィードバックである。
私の上司は東大卒、外資系コンサル出身のキレッキレのビジネスマンである。毎週、1on1の時間をもらい案件相談をさせて頂いているのだが、その際に受けるフィードバックと同じぐらいo1 pro modeで生成されるアウトプットは一つひとつのプロンプトに対して「より最適に」「よりわかりやすく」応えてくれていると感じることができる。
OpenAIからの発表では「数学」「プログラミング」「博士レベルの問題」の3分野においての発展に関するリリースであったが、ビジネスのシーンでも十分に成果を期待できる仕上がりである。
金欠サラリーマンはこれからもo1 pro modeを利用し続けるのか!?
これまで案内の通り、o1 pro modeは一般のビジネスマンの業務でも十分に成果を発揮してくれると確信している。
問題は月額$200(約3万円)を引き続き課金し続けることができるのかである、、、
3万円あれば、家族で美味しいものを食べたり、ちょっとした旅行にも行くことができる。年間36万ともなれば、海外旅行にだって十分いけるであろう。
そんな大金を払い続けてでもo1 pro modeを使い続ける必要があるのかについては今すぐには結論は出せない。
キレッキレ上司に相談し放題だと考えれば安すぎるのかもしれないが、、、
しかも、恐ろしいことに、一度o1 pro modeを利用してしまうと、従来のモデルのアウトプットでは物足りなさを感じてしまう。
が、やはり3万は高い、、、
こればっかりはもう少し使っていく中で答えを出したいと思う。
おわりに
今回、o1 pro modeの凄さを少しでも共有できればと思い記事にしてしました。皆さんにもo1 pro modeの凄さが伝われば幸いです。
引き続き、o1 pro modeを利用していく中で気付いたことがあれば改めて記事させて頂きます。
また、コメント欄にo1 pro modeにインプットしたいプロンプトを記載して頂ければ、私の方で試してシェアさせて頂くことも可能です。
引き続き、次回の共有をお楽しみに!