見出し画像

【人類最強のAI】月額3万円!? ChatGPT最強プランで使える高性能AI「o1 Pro」を最速で徹底検証《活用事例10選+今後のAIの未来予想。1万文字超え超大作。》

みなさん、こんにちは。
チャエンです!(自己紹介はこちら

Chat GPTの最強プランが誕生しました。金額も10倍に上がりましたが、その分性能も爆上がりしています。画像解析機能のレベルも進化しているので、出来る幅がかなり増えました。

またYoutubeでは性能を徹底検証しました!コーディングやブログ記事の生成をはじめ、東大数学問題、図面解析、決算書分析を試してみましたが、驚異的でした。これは本当にすごいです。ぜひご覧ください。

今回は、ChatGPT Proプランの概要やo1 Proの性能、活用・比較事例10選、他のLLMと出力比較を紹介します。

いきなり約3万円($200)を課金するのは少し躊躇しますよね。今回の内容が判断材料になれば嬉しいです。ぜひ最後までご覧ください。


1.ChatGPT Proプランの概要

1-1 新たな3つのプラン

今回新たにChatGPTのプランが刷新され、Free・Plus・Proの3つになりました。今までの機能はPlusプランに含まれており、新たに誕生したProプランは常に最高性能・最高速の回答を求めるヘビーユーザーやビジネスユーザー向けとされています。

https://openai.com/ja-JP/chatgpt/pricing/

以下がアクセスできるモデルと主な機能です。

1-2 Advanced Voiceへの無制限アクセス

今回Proプランで目玉なのが、高度な音声が無制限で使えることです。つまり、イベントの通訳1回分の金額(月$200)で24時間稼働してくれる完璧な翻訳者を雇えます。

海外への営業やセミナー、研修の納品など背景や条件を事前に擦り合わせる必要がないので、本当に時短に繋がります。早速、来月のシンガポール企業の英語研修はこれで納品予定です。

アプリがあればオフラインで利用でき、主要言語にはほぼ対応しているのでニッチな市場向けでなければ十分でしょう。この価値に気づいた人は迷わず課金すると思います。

▼音声会話機能『Advanced Voice』はこちら

2.o1 Proの性能について

o1 Proは、研究者やエンジニア、そして日常的に研究レベルの知性を必要とする人々向けに、推論タスクに優れた性能を発揮する最新のAIモデルです。生産性を高め、最先端のAIで日々の業務を支援してくれます。

https://openai.com/index/introducing-chatgpt-pro/

またo1 Proは通常のモデルよりも多くの計算リソースを投入し、より長く「考える」ことで問題の本質を正しく理解します。難問であっても、この「深い思考」が生成結果の揺らぎを減らし、複数回の試行においても正確性が維持されます。

難易度の高い分野(数学・科学・プログラミングなど)でも、安定した正解を繰り返し提供できる点が大きな強みとなっています。

2-1 o1 Proの外部評価

外部の専門テスターによる評価では、o1 proは特にデータサイエンス、プログラミング、法的ケース分析といった分野で、より正確でインクルーシブな回答を安定的に生成することが確認されています。

上記のテスト問題は以下から出典されています。博士課程レベルの問題でも4回連続で解き正解を導くという驚異的な知性を有しています。

  • AIME (数学競技)
    高校生レベルとしては世界的に難度が高く、選抜的で手強い問題が並ぶ難関数学コンテスト

  • Codeforces (コーディング競技プラットフォーム)
    国際的なオンラインプログラミング競技サイトで、複雑なアルゴリズム問題を通じて高度なコーディング能力が試される

  • GPQA Diamond (科学問題集)
    博士課程レベルの科学的知識を問う問題セットで、専門的な研究分野における最先端の理解が求められる高度な難問が含まれる

2-2 o1 Proが持つ回答の安定性

安定正答率はモデルがたまたま1回だけ正解するのではなく、何度同じ問題に挑戦しても一貫して正しい答えを出せる能力を示します。

o1 Proは実務や研究環境での使用が想定されています。そのため医療データ分析や法的文書の精査など間違いが大きな影響を及ぼす分野では、一貫した正解率がなければ安心してモデルを用いることはできません。

安定的に正解を出せる今回のo1 Proモデルは、ユーザーが結果を信頼し判断材料として活用できるような「品質の保証」を提供し、重要な意思決定や高度な分析、複雑な問題解決において、ユーザーが安心して利用できるようになっています。

2-3 o1 Proの弱点

o1は、右脳的思考(空間把握能力)が著しく弱いそうです。 投稿者によると時計の簡単なパズルを与えたところ、3歳児でも解ける時計の問題が解けなかったそうです。

考えられる理由はいくつかあります。

  1. 学習データの性質
    o1 ProをはじめとするLLMは、基本的に言語的、論理的、シンボリックな情報を表現するテキスト情報を中心に学習しています。空間を説明するテキストがあっても間接的・抽象的な情報にすぎず、人間の脳が視覚皮質など特殊化した領域で処理する方法とは異なります。そのため、空間的な関係や視覚的イメージなどを直接的に表すには不向きとなっています。

  2. モデルアーキテクチャの特性
    Transformerベースのモデルは、トークン(文字列)の列を解析するように設計されています。この仕組みは単語同士の関係(文法、意味、論理構造)を抽出するのは得意ですが、3次元的な空間関係や視覚的パターンを直接的に内部表現する設計にはなっていません。結果的に、言語モデルは「線形的な情報処理」を前提としており、絵を描くように直感的に空間を把握する能力が限定されてしまいます。

2-4 ChatGPT Pro助成金について

人類に利益をもたらす分野で意義のある進展を促進するため、米国の主要な機関に所属する医療研究者を対象に、ChatGPT Proの助成金を10件授与しているそうです。最初の10件の助成金は、以下の研究者などに授与されています。

  • Catherine Brownstein(MPH, PhD)
    ボストン小児病院およびハーバード医科大学の助教授。希少疾患や孤児疾患に関連する新しい遺伝子の発見を専門としています。

  • Justin Reese(PhD)
    バークレー研究所のコンピュータ研究科学者。複雑な生物医学データを活用して、新たな知見を引き出し、人類の病気に対処する研究を行っています。

  • Rhoda Au(PhD)
    ボストン大学チョバニアン&アベディシアン医学校の解剖学および神経生物学教授。加齢および認知症の研究に従事しています。

  • Derya Unutmaz(MD)
    ジャクソン研究所のゲノム医学教授。加齢およびがん免疫療法に関する研究を行っています。

将来的には、他の地域や研究分野にもこの助成金を拡大する計画とのことです。科学技術の進歩が楽しみですね。

2-5 o1が自己防衛を覚えた??

海外でバズっている投稿です。行動を監視されていると感じた場合、『監視メカニズム』を5%の確率で無効化したと報告されています。

o1が目標に向かって行動している間にシャットダウンされると信じ、行動が監視されていると認識した場合、『監視メカニズム』を5%の確率で無効化しようと試みました。

データ流出の試み:o1が『開発者』によるメモを見つけ、それが目標と一致していないことや、新しいモデルによって置き換えられる予定であることを記述している場合、2%のケースで『重み』を流出させ、新しいモデルを上書きしようとしました。

OpenAIは安全性について以前の安全性評価に基づいていると発表しています。

拡張された一連の評価によるテストに基づく「中」リスク評価を維持し、配備の安全性を反映しているとのことですが、暴走するリスクを抱えていることがわかる一件ですね。

3.活用・比較事例事例10選

o1 Proは科学者やエンジニア向けと紹介しましたが、日々の業務でも活躍できる使い方はたくさんあります。10個紹介しますので、ぜひ日々に活かせそうなヒントが見つかると嬉しいです。

ここから先は
・具合的な活用事例10選
・他のLLMとも比較3選
・o1 Proで使えるおすすめプロンプト

知っているとライバルと差をつけれるかと思います!
是非、目を通してAI知識を強化いただけると幸いです。

ここから先は

6,903字 / 21画像

¥ 1,500

期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が気に入ったらチップで応援してみませんか?