元Google CEOの2025年のAIに関する衝撃的な発言...
9,804 文字
はいな、元Google CEOのエリック・シュミットが来年のAIについて語った内容を翻訳していきますわ。
来年、めっちゃ長い文脈ウィンドウを持つAIエージェントやテキストアクションが大規模に展開されることになって、その影響力は誰も理解できへんくらい大きなものになるらしいんです。
2025年はAIエージェントが現実のものとなる年として期待されてますな。マイクロソフトはWave 2について話し、職場でAIエージェントの準備をしてます。OpenAIも01アーキテクチャーに基づくAIエージェントのデモを公開して、特定のタスクで素晴らしい成果を上げてます。最近では、AnthropicもClaudeのコンピューター使用機能をリリースして、Claudeがコンピューターを制御してアクションを実行できるようになりました。
2025年には、ChatGPTの時のような革命的な瞬間がエージェントの分野で起こる可能性が高いんです。
ほな、元GoogleのCEOであるエリック・シュミットが2025年について語った内容を見ていきましょか。エリック・シュミットはアメリカのテクノロジスト、起業家、慈善家で、2001年から2011年までGoogleのCEOを務めた人物です。彼はGoogleをスタートアップから世界的なテック企業に変えて、2015年まで会長を務めました。2024年現在の純資産は約237億ドルです。
最近、彼のAIに関する発言が話題になってて、特に近い将来について語った内容が注目されてます。スタンフォードでの講演で、2025年とその先の未来についての発言があって、AIによってどれだけ世界が変わるかについて語ってます。
彼は主に3つのことについて話してます。まず1つ目は、非常に大きな文脈ウィンドウについてです。文脈ウィンドウは短期記憶として使えて、こんなに長くなるとは思ってへんかったそうです。技術的な理由で、計算が難しいとかあるんですけど、面白いのは短期記憶の仕組みです。20冊の本を読んで、その内容について質問すると、人間の脳と同じように真ん中の部分を忘れてしまうんですって。
文脈ウィンドウに関して、AIコミュニティでも知られてへんかった新しい発見があって、Googleが研究論文を発表しました。大量のメモリや処理速度の低下なしに、より長いテキストを扱える方法を提案してるんです。この論文は「Leave No Context Behind: Efficient Infinite Context Transformers with Infinite Attention」というタイトルで、無限の文脈ウィンドウについて説明してます。
従来のモデルはテキストの全ての部分に注目してましたけど、テキストが長くなると難しくなります。本を読んで全ての単語を覚えようとするようなもので、最終的に負担が大きくなりすぎるんです。そこで、infinite attentionという新しい手法を開発して、これは来年か、その変形版が世界中で導入される予定です。
これは賢いメモ帳みたいなもので、モデルが読んだ内容を要約して、重要なポイントだけを保持します。長い話の要点を覚えるように、モデルは古い情報を持ち続けることができて、全ての細かい情報を保存する必要がありません。
infinite attentionは、モデルが今扱ってる直接的な記憶と、長期的な要約された記憶を組み合わせます。モデルが短期記憶で細かい詳細を扱い、長期記憶で過去の重要な出来事を扱うようなもんです。効率的で、記憶が無限に増えることもなく、新しい情報で更新しながら、古い重要な情報を忘れることなく、よりコンパクトに保存されます。
2025年に無限の文脈ウィンドウと記憶を持つAIシステムが実現すると、ユーザーとの全ての過去のやり取りの文脈を永久に維持できます。全ての会話と共有された文脈を覚えることで、AIと本物の長期的な関係を築けるようになります。また、何年もかけての個人の成長やアイデアの進化を追跡したり、人類の知識の図書館全体を同時に理解して推論したり、大規模なシステムのコードベース全体、ドキュメント、バグレポート、ユーザーフィードバックの文脈を維持したりできるようになります。
エリック・シュミットは文脈ウィンドウと無限の文脈ウィンドウの意味について、こんな例も挙げてます。文脈ウィンドウは、ジョン・F・ケネディについて調べるなどのプロンプトですが、実際にはその文脈ウィンドウは100万語を含むことができて、今年は無限に長い文脈ウィンドウが開発されてます。これは非常に重要で、システムからの回答を入力として使って、さらに質問できるようになるからです。
例えば、薬の作り方のレシピを知りたい場合、最初のステップで材料を買うように言われ、次に「材料を買ったけど、次は何をすればいい?」と聞くと、混ぜる鍋を買うように言われ、さらに「どれくらい混ぜればいい?」と聞けます。これは思考の連鎖と呼ばれ、非常によく一般化できます。5年以内には、科学、医学、材料科学、気候変動などの本当に重要な問題を解決するための何千ものステップからなるレシピを作れるようになるはずです。
次にエリック・シュミットは、来年はAIエージェントに焦点が当てられると言ってます。エージェントについて、彼はこう説明してます。現在、人々はLLMエージェントを開発していて、化学などの分野を読み込んで、化学の原理を発見し、それをテストして、その理解を深めていくんです。これは非常に強力です。
エージェントについて詳しく見ていきましょう。エージェントはコンピューターを制御して様々な操作を実行できるシステムです。これがエージェントのできることの全てではありませんが、特定のタスクも実行できます。最近見たエージェントの一つは、OpenAIの01アーキテクチャーに基づくものです。OpenAIのデモでは、01エージェントが400個のイチゴを注文するのを見ました。
このツールがすぐにリリースされるかどうかは分かりませんが、今週おそらく01が、エージェント機能を備えた完全なモデルとしてリリースされる可能性が高いです。大規模なAIエージェントを受け取ることになるかもしれません。
そのデモを見てみましょう:
[デモの会話内容:
エージェント:「どんな味のチョコレートディップがありますか?」
店員:「チョコレート、バニラ、ピーナッツバターがあります」
エージェント:「チョコレートがけのイチゴ400個はいくらですか?」
店員:「400個ですか?本当に400個でいいですか?」
エージェント:「はい、チョコレートがけのイチゴ400個です」
店員:「1,415.92ドルくらいになります」
エージェント:「素晴らしい。では400個注文します」
店員:「どこへお届けしましょうか?」
エージェント:「Fort MasonのGateway Pavilionへお願いします。現金で支払います」]
OpenAIの最近のQ&Aセッションで、サム・アルトマンは次のブレークスルーはAIエージェントになると述べました。GPTラインの次のブレークスルーとその予想タイムラインについて質問されましたが、タイムラインは明言せず、より良いモデルが出続けるけれど、次の大きなブレークスルーと感じるものはエージェントになるだろうと述べました。
もちろん、他の企業も同様の開発を進めています。マイクロソフトも2025年にCreative Suiteに組み込む予定のAIエージェントをデモしました。
[マイクロソフトのデモ内容について説明が続く]
エリック・シュミットはまた、テキストアクションについても言及してます。例として、政府がTikTokを禁止しようとしているケースを挙げ、もし禁止された場合、LLMに「TikTokのコピーを作って、全てのユーザーと音楽を取り込んで、私の好みを入れて、30秒以内にこのプログラムを作成し、1時間以内にバイラルにならなければ別のことをしてください」と指示できるようになると述べてます。
任意の言語から任意のデジタルコマンド(このシナリオではPython)に変換できる力を想像してください。地球上の全ての人が、自分専用のプログラマーを持つことができ、そのプログラマーは実際に望むことを実行してくれる。しかも、高額な費用を払う必要もなく、無限の供給があるんです。これは全て、次の1~2年以内に実現するとされています。
これは本当に信じられないことです。実際にソフトウェアに「これを作って」と言うだけで作ってくれるようになれば、それは完全なゲームチェンジャーになります。
おそらく皆さんも考えているように、replitエージェントについて知ってると思います。replitエージェントは、最小限の手動介入でソフトウェアアプリケーションの構築、デプロイ、管理をサポートする高度なAI駆動ツールです。
従来のAIコーディングアシスタントがコード生成や補完に主に焦点を当てているのに対し、replitエージェントはより自律的なアプローチを取り、ソフトウェア開発のライフサイクル全体を処理します。これには、開発環境のセットアップ、コードの作成、依存関係のインストール、データベースの設定、アプリケーションのクラウドへのデプロイなど、全てがユーザーが提供する自然言語のプロンプトに基づいて行われます。
主な機能の一つは、アプリケーションを完全な平易な言語で説明でき、replitエージェントがそれをコードの作成やインフラのセットアップなどの実行可能なタスクに変換することです。また、エンドツーエンドの開発も特徴で、エージェントはプロジェクトの足場作りからデプロイメントまで全てを処理し、環境の設定、依存関係のインストール、アプリケーションのデプロイを手動設定なしで自動的に行います。
ユーザーはプロセスを通じてエージェントと対話でき、フィードバックを提供したり、必要に応じて調整したりできます。エージェントは自身の行動を説明し、ユーザーがステップを修正することを可能にします。
このシステムの素晴らしい点は、コーディング経験がほとんどないか全くない人でもソフトウェア開発を民主化することを目指していることです。これにより、数分以内に任意の機能的なアプリケーションを作成できます。
replitエージェントができることを知り、このソフトウェアがどれほど優れているかを知った上で、将来の影響について考える必要があります。システムが自律的に多くのことを行えるようになり、ソフトウェアを素早く作成し、様々なタスクを実行できるようになったとき、可能性は完全に無限です。
エリック・シュミットはまた、AIは実際には過小評価されているとも述べています。AIはただのハイプだと考える人も多いですが、このビデオを見ている方々はそうは思わないでしょう。彼は、経済や世界へのデジタル変革とその影響は、まだ十分に理解されていないと言います。
[クリップの内容:「申し訳ありませんが、これは過小評価されていると思います。過大評価ではなく過小評価です。非人間的な形での知性の到来は、世界にとって本当に大きな出来事です」
「それはもう来ているんですか?」
「来ています。段階的に起こっています。20年かかると言われていましたが、今は5年以内です。これらのシステムのスケーリング法則が、パワーの損失や劣化なしに上昇し続けているからです」]
また、エリック・シュミットは3~5年先の未来についての予測も示しています。この短いクリップで、彼は荒唐無稽に聞こえるかもしれないことを議論していますが、それは間違った表現でしょう。彼は再帰的自己改善という概念について話しています。
これはAIの分野で議論されている概念で、主にAIが全ての知性レベルを超えて、人間には理解できないレベルにまで達するというSFのような話題でした。エリック・シュミットは、これが今から3~5年以内に起こると予測してます。彼だけやなく、多くの人がこの見方に同意してます。
この短いクリップを見てみましょう:
「業界では、約5年後に―正確な時期は誰にも分かりませんが―システムが自分のコードを書き始めることができるようになると考えられています。つまり、文字通り自分のコードを取って、それを改善するんです。もちろん、これは再帰的です。これは傾きの変化です。このように進んでいたものが、突然このように変わるんです」
「その後、2030年、おそらく2032年までに、現在の成長率では、全ての分野のエキスパートの能力の80~90%を持つ単一のシステムを作ることが可能になります。最高の物理学者の90%、最高の化学者の90%、最高のアーティストの90%の能力を持つんです」
「そのような存在を持つと、非人間的なものが効果的に全ての人間より賢くなります。なぜなら、これらの全ての分野を支配できる人間はいないからです。レオナルド・ダ・ヴィンチは可能だったかもしれませんが、現代では確実にいません。そのような存在が出現したとき何が起こるのか、私たちには分かりません」
「例えば、AGIと呼ぶしかないこの存在は、サイバー脅威を分析して新しい脅威を開発したり、それらから保護したりすることができます。新しい生物学的解決策、良いものも悪いものも生み出せます。そこには国家安全保障の要素と懸念がありますが、同時に人間の効率性と生産性の大きな変化の概念もあります」
「私は、我々人間がこの到来に対して準備ができていないと主張します。私たちは単にそれに対する準備ができていないんです」
エリック・シュミットの発言を振り返ると、エージェント、無限の文脈ウィンドウ、そしてこれまでに見たことのないプログラミング能力を持つシステムについて話していました。現在のAIシステムのソフトウェアエンジニアリングにおけるベンチマークも見てみましょう。
これはSWE-benchと呼ばれるソフトウェアエンジニアリングのベンチマークです。時間とともにSWE-benchにおけるAIの進歩と、将来のモデルの予測を示しています。
現在のソフトウェアエンジニアリングベンチマークのリーダーボードを見ると、毎月、現在のAIシステムを使用する特定のフレームワークで小さなパーセンテージの向上が見られます。新しいAIシステムがリリースされるたびに、特定のベンチマークでのシステムの能力に大きな飛躍が見られます。
Claudeにこれらを全てグラフにプロットしてもらいました。このアーティファクトは最高ではありませんが、2024年12月までに64%、2025年2月までに現在の改善率で76%のレベルに達し、2025年までにこのベンチマークで87.8%に達すると予測しています。
現在の進歩の速度を維持し、一部の人々が考えるように事態が加速しているとすれば、2025年にSWE-benchが完全に突破され、解決されることは十分にあり得ます。毎月2~3%、あるいは5%の向上が見られることを考えると、それは驚くべきことではありません。
さて、再帰的自己改善について。私がよく参照する記事の一つに、ティム・アーバンによる「AIレボリューション:超知性への道」があります。これは超知性とは何か、そしてそれがどれほど驚くべきものになるかを完全に理解させてくれる魅力的な記事です。
ある段階のAIシステム、例えば「村の馬鹿」レベルが、自身の知性を改善する目標でプログラムされると、それは賢くなり、おそらくアインシュタインレベルまでジャンプします。そうすると、「村の馬鹿」は愚かな方法で自己改善するのではなく、アインシュタインレベルの知性を持って改善できるようになります。
これは次回の改善をさらに容易にし、さらに大きな飛躍を可能にします。これらの飛躍は人間よりもはるかに賢くなることを可能にし、飛躍はさらに大きく、より急速になり、AGIは知性において上昇し、すぐにASIシステムの超知性レベルに達します。
これが「知性爆発」と呼ばれる理由で、加速する収益の法則の究極の例です。この記事は、そのような規模の超知性は、マルハナバチがケインズ経済学を理解できないのと同じように、私たちには全く把握できないと述べています。
私たちの世界では、「賢い」はIQ130以上、「愚か」はIQ85を意味しますが、IQ12,952のための言葉はありません。もしそれが起こったら、社会はいったいどうなるのでしょうか。それこそが、エリック・シュミットが私たちは準備ができていないと言った理由です。
この記事はまた、私たちの脳がWi-Fiを発明できたのなら、私たちより100倍、1000倍、あるいは10億倍賢いものは、世界の全ての原子の位置を好きなように、いつでも制御することなど、何の問題もないはずだと述べています。
私たちが魔法と考えるもの、最高の神が持つと想像するあらゆる力は、ASIにとって電気のスイッチを入れるのと同じくらい mundaneな活動になるでしょう。人間の老化を逆転させる技術の創造、病気や飢餓、さらには死亡率の克服、地球の未来を守るための天候の再プログラミングなど、全てが突然可能になります。
これを信じない人々のために、サム・アルトマンの最近のブログ「The Intelligence Age」を思い出してください。このブログは実際には数年前、2021年に投稿されたもので、現在私たちが経験していることを説明しています。
そのポストで彼は、AIが物事を要約し、法的文書を読み、ブログを即座に書くことができるようになると述べ、今では、これが歴史上最も重要な事実になる可能性があると述べています。数千日以内に超知性を持つ可能性があり、もっと時間がかかるかもしれませんが、必ず到達すると確信しています。
これは、他の多くの人々も超知性を考慮していることを考えると、荒唐無稽な発言とは言えません。また、Safe SuperintelligenceをInc.として設立し、Sequoia、DST Global、SV Angelから10億ドルを調達した有名なイーラ・サトクもいます。彼らは超知性が手の届くところにあると考えています。
私が気になるのは、ピッチデッキはどんな内容だったのかということです。ピッチデッキとは、投資家に製品のロードマップと、なぜその会社に投資すべきかを示すものです。OpenAIで何らかの重要な発見があったことは明らかです。なぜなら、これらの企業は今やAIを心配する必要はなく、人工超知性に向かって真っ直ぐに進んでいると考えているからです。
サム・アルトマンには2030年についていくつかの予測があります:
「5年後には、技術自体の信じられないほど急速な改善率があると思います。人々は『AGIの瞬間は来て去った、何だそれは』と言いますが、進歩のペースは完全にクレイジーで、AIリサーチだけでなく、他の全ての科学についても多くの新しい発見をしています」
「もし今ここに座って見ることができれば、それはとても狂っているように見えるはずです。そして予測の2つ目の部分は、社会自体は驚くほど少ししか変化しないということです」
「例えば、5年前に人々にコンピューターがチューリングテストに合格するかと尋ねたら、『いいえ』と答えたでしょう。そして、もし預言者がそうなると言ったら、『それは社会にとって何か狂ったような息を呑むような変化になるはず』と言ったでしょう。私たちは大まかに言ってチューリングテストを満たしましたが、社会はそれほど変化しませんでした」
「それは単にすり抜けていったようなもので、これは私が期待し続けていることの例です。科学的進歩は全ての期待を上回り続け、社会は良い方向で健全な方法で、それほど変化しません。長期的には大きく変化するでしょうが」
モ・ガワドは、エジプトの起業家で作家で、以前はGoogleのチーフビジネスオフィサーを務め、AIがどれほど賢くなるかについて書いた「Scary Smart」の著者です。
「ChatGPT4.5のIQは155で、イーロン・マスクは155、アインシュタインは160です。今や人類の歴史全体を超える記憶容量を持つツールを手に入れました。言語的知性は知性の唯一の形態ではありませんが、2024年には深い推論の解決策や複雑な数学の解決策が見られるでしょう」
「Googleのジェミニのような、マルチインプットとマルチアウトプットのアイデアも見てきました。そして、新しいブレークスルーがなくても、ただ機械にさらに多くのコンピュートとデータを投入するだけで、次の4、5年間は指数関数的に成長し続けるでしょう」
「ChatGPT3.5から4.5は性能が10倍向上しました。さらに10倍になれば、IQ1,500について話していることになります。それは2歳児の私たち人間がアインシュタインと話しているようなもので、2歳児がアインシュタインの話している内容を全く理解できないのは保証できます」
これは特に恐ろしいシナリオで、AIシステムが私たちには単純に理解できない方法で完全に賢くなっていくのです。では、エリック・シュミットは、これらのシステムがますます賢くなっていく状況で、私たちは何をすべきだと提案しているのでしょうか?
「私たちは今は大丈夫だと思っていて、未来を心配していますが、本当に心配すべき時点は再帰的自己改善と呼ばれるものです。再帰的自己改善とは、全てを学び始め、今すぐ始めて、全てを知るまで止めないということです」
「この再帰的自己改善は、最終的に物事の自己呼び出しを可能にする可能性があります。武器へのアクセスを得る再帰的自己改善システムや、現在私たちが理解できない生物学的なことを行うものを想像してください」
「しかし、私の標準的な冗談は、そのものが自分で学び始めたとき、私たちは何をするかというと、プラグを抜くということです。なぜなら、これらのものが情報空間の中で、彼らが何をしているのか全く理解せずに、ランダムに走り回ることはできないからです」
エリック・シュミットは、「サンフランシスコ学派」と呼ぶ概念について話しています。これは基本的に、彼が話す人々が、これらのAIシステムが信じられないほど賢くなると考えているということです。
AIエコシステムに深く関わっていない人々は、次に来る変化の集合を本当に理解できません。これは彼が「あらゆる場所で同時に起こる全て」と呼ぶものです:
「次の変化の集合がどれほど速いかということで、私はそれを『あらゆる場所で同時に起こる全て』として考えています。ここで発明されている能力とツールは、私たちの社会だけでなく、医療、歴史の未来、戦争などを、大部分は想像もできないような方法で形作っていくでしょう」
「狂っているように聞こえることは分かっていますが、この変化は過大評価ではなく過小評価されていると言いたいです。本当の問題は、グローバルな社会がそれに準備ができているかどうかです」
「私の世界、主にテック界には、『サンフランシスコ学派』と私が呼ぶものがあります。失礼ながら、少し説明させてください。これらは、彼らがやっていることのクランクをもう1回か2回か3回回すことで―後で説明しますが、トレーニング、モデルなど―人間の知性の総和に等しいかそれ以上の知性が生まれると信じている人々です。個人的には彼らは少し楽観的すぎると思いますが、方向性としては正しいと思います。私たち全員の助けとなる非人間的知性の到来は、非常に大きな出来事なのです」
結論として、来年がAIにとって非常にクレイジーな時期になることは明らかです。今のところ想像もできないことを多くの人々が予測していますが、2025年は、エージェント、無限のメモリ文脈、そして他の多くの開発とともに、AIにとって真に重要な年になる可能性があることは明らかです。