見出し画像

Chat GPT o1-preview の評判をまとめてみた

私がいつもAI関連の最新情報を収集する際に参考にさせて頂いているKEITOさんが、先日、「ChatGPT解約する?その前に現状整理」という動画を公開されていました。

文章作成はそもそもClaudeの方が上手ですし、GPTsに関してもClaudeに類似の機能が搭載されたので、Claudeに課金しておけばChat GPTは不要ではないか?Sora(動画自動生成)や新モデル(Strawberry)は、「出る出る詐欺」で、いつ搭載されるかわからないし。。。

というKEITOさんのメッセージが届いたかのごとく、その翌日に新モデル「Chat GPT o1-preview」が発表となりました。

私自身は、Claude派でそもそもChat GPTに課金しておらず、使うことができないので、まずはネット上の評判を整理してみました。

■Perplexityによるまとめ

ChatGPTの新モデル「o1-preview」に関するネットの反響を以下のように整理しました。

高度な推論能力への評価
多くのユーザーが高度な推論能力に驚きと期待を示しています。
- 国際数学オリンピックの予選問題で74.4%の正答率を達成し、GPT-4oの9.3%を大きく上回ったことが特に注目されています。
- 複雑な数式やプログラミングタスクに優れており、これらの問題を手軽に解決できる点が高く評価されています。

思考プロセスの可視化
o1-previewの特徴的な機能として、「思考時間」を設けて推論プロセスを表示する機能が話題になっています。
- ユーザーの入力に対して即答せず、人間のようにじっくりと考える時間を取る点が注目されています。
- 「思考時間」をクリックすると推論経過が表示され、AIの思考プロセスを追跡できる点が興味深いと評価されています。

利用制限と料金
o1-previewの利用には制限があり、料金設定についても議論されています。
- ChatGPT PlusとTeamユーザーは週30メッセージまでの制限付きで利用可能です。
- API利用の場合、100万入力トークンあたり15ドル、100万出力トークンあたり60ドルという価格設定が公開されています。

他のモデルとの比較
o1-previewは、既存のGPT-4oや同時に発表されたo1-miniとの比較で議論されています。
- 一般的なタスクではGPT-4oの方が優れている可能性がありますが、複雑な推論タスクではo1-previewが大きく上回る性能を示しています。
- o1-miniは、o1-previewと比べてコスト効率に優れ、より軽量なタスクや日常的な使用に適しているとされています。

今後の期待と課題
o1-previewの登場により、AIの可能性がさらに広がったという期待が高まっています。
- 教育機関や企業ユーザーにとって魅力的な選択肢となり、ビジネスや教育分野での高度なAI活用が促進されることが期待されています。
- 一方で、現時点ではWeb検索やファイル・画像のアップロード機能に対応していないなど、一部の制限も指摘されています。

全体として、o1-previewはAI技術の新たな進化を象徴するモデルとして注目を集めており、その高度な推論能力と思考プロセスの可視化機能が特に評価されています。同時に、利用制限や料金設定、既存モデルとの使い分けなどについても活発な議論が行われています。

Citations:
[1] https://miralab.co.jp/media/chatgpt-o1/
[2] https://www.tokachi-ichiba.com/o1-preview-mini/
[3] https://chat-gpt.school/openai-o1/
[4] https://note.com/hantani/n/n2d382e0d2cc5
[5] https://ai-workstyle.com/gpt-o1-preview-mini/
[6] https://www.itmedia.co.jp/aiplus/articles/2409/13/news089.html
[7] https://chatgpt-lab.com/n/ne6bae1edebfd

■Gensparkによるまとめ

ChatGPTの新モデル「o1 preview」に関するネットの反響を整理しました。

 高評価ポイント
1. 推論能力の向上
- 「o1 preview」は、科学、コーディング、数学分野で特に優れた性能を発揮しています。国際数学オリンピック予選試験で83%のスコアを獲得し、以前の13%から大幅に向上しました。

2. 安全性の強化
- モデルの「ジェイルブレイク耐性」が向上し、不適切な回答を避ける能力が強化されています。

3. コーディング能力
- コーディングコンテスト「Codeforces」で上位11%に到達し、開発者から高く評価されています。

改善点と課題

1. 機能の制限
- 現在は初期段階のモデルであり、Web閲覧やファイル・画像のアップロードなどの機能は未対応です。

2. 利用制限
- ChatGPT PlusとTeamユーザーは9月12日から利用可能ですが、無料ユーザーはまだアクセスできません。週間メッセージ制限も存在します(o1-previewで30メッセージ、o1-miniで50メッセージ)。

3. 実用性の課題
- 日常業務ではまだGPT-4oの方が有能とされており、特定の専門分野での利用が推奨されています。

価格と利用方法

- 料金体系
- ChatGPTプランに追加料金はなく、API利用も可能ですが、レート制限があります。

- モデル選択
- ユーザーは手動でモデルを選択する必要がありますが、将来的には自動選択機能が追加される予定です。

このように、「o1 preview」は特定分野で高い評価を受けつつも、まだ改善の余地があることが指摘されています。今後のアップデートにより、さらに多くの機能が追加されることが期待されています。

要約すると、「高い推論能力を備えており、数学やプログラミング等、推論が重視される場面では威力を発揮するが、現時点では利用制限もあり、日常使いでは従来のGPT-4oで十分」とのことです。

私がよく参考にさせて頂いているmikimikiさんとKEITOさん。mikimikiさんは画期的なツールが出たと絶賛しているのに対し、KEITOさんは、自分には使い方がピンと来ない。当面、4oで十分ではないか?と評価が分かれているのも興味深いです。


いいなと思ったら応援しよう!

マルセロ| 事業プロデューサー
いつもお読み頂きありがとうございます。サポート励みになります。皆さまとの交流をどんどん広げていければと思います。

この記事が参加している募集