見出し画像

グーグルのAIエージェントチームに関する驚くべき事実 | 制御不能なAGIウイルス

8,536 文字

まぁ、グーグルがAIエージェントの競技場に参戦したんですわ。The Informationの報道によると、グーグルはコンピューターを制御できるAIを準備してるらしいです。アートワークもめっちゃカッコええですね。
この時点で、みなさんもご存知かもしれませんが、インターネットはAnthropicのAIエージェントのリリースで大騒ぎになってます。Anthropicは新しいモデル、というか既存モデルの改良版と一緒にコンピューター制御機能を発表しました。他のAI企業も黙ってへんのは分かってますよね。みんな自社のモデルやAIエージェントをリリースしようと準備してて、競争が白熱してきてるんです。
グーグルの内部事情に詳しい人らによると、このAIエージェントソフトウェアはウェブブラウザを制御して、リサーチの収集や商品の購入、航空券の予約なんかのタスクをこなせるようになるらしいです。
まぁ、グーグルは多くの意味で、このAIレースのきっかけを作ったと言えるでしょう。少なくとも大規模言語モデルに関しては、2017年にTransformerアーキテクチャーを開発したことで、多くの物事を動かす最初のドミノを倒したと言えます。でも、ある時点で出遅れてしまって、このグラフの青い線で示されているOpenAIのChatGPTに追い抜かれました。
このグラフは100%正確じゃないかもしれませんが、GeminiモデルやClaude、Anthropic、それにxAIのGroなんかと比べると、最近グーグルは様々な面で追い上げてきてます。重要な製品をたくさんリリースして、高い評価を得てます。最近では、Notebookのデモが話題になって、ニュースでも取り上げられて、多くの人が興味を持ちました。まだアップデートを出し続けていて、たくさんの人に使ってもらってます。
もちろん、グーグル本体はAlphabet傘下の一部で、その中にはDemis Hassabisが率いるGoogle DeepMindもあります。彼は間違いなく今のAI界で最も影響力のある人物の一人です。最近、タンパク質折りたたみのAlphaFoldの画期的な成果で化学のノーベル賞を受賞しました。
AlphaProteoのカスタムデザインタンパク質による創薬の進展や病気の治療への貢献など、まだ話題に上がってない舞台裏の成果もたくさんあります。それぞれが驚くべき成果なんです。
AlphaChipってのもあって、多くがAlphaって名前で始まります。チェスやGo、ビデオゲームをプレイして自分のスコアを超えようとする自己対戦や、合成データを生成するという考え方に基づいてます。
例えばAlphaChipは、AIチップの設計を効率化します。文字通り自分のハードウェアを設計してるようなもんです。AlphaChipが設計に関わったチップの多くは実際に使われていて、あなたが使ってるテクノロジーや携帯電話の一部は、このAIモデルによって設計されたかもしれません。
驚くべきことに、AlphaGeometryとAlphaProofという二つのモデルは、国際数学オリンピック(IMO)で金メダルまであと1点というところまで行きました。これがもっと大きなニュースにならなかったことに驚きました。AIモデルが世界最高の数学者たちと肩を並べるところまで来てるんです。金メダルまであと1点やったんです。来年にはおそらく金メダル取るでしょうね。
DeepMindチームの方面は、すごいものを次々と生み出してます。「イーロン・マスクに賭けるな」って言いますやん?今やDemisにも同じこと言えます。AIの分野で最先端の驚くべき技術を出し続けるでしょう。化学のノーベル賞まで取ってるんです。しかも彼は化学者じゃないんです。これらのモデルを作って科学的なブレークスルーを生み出して、まだAIモデルに直接賞を与えるような時代じゃないから、作った人に賞が与えられるわけです。
AlphaFoldとタンパク質科学の分野全体、つまりタンパク質とその働きを研究する分野が、これらのAIモデルを使った新しい発見と交わるところ、そのクロスポイントが私にとってはめちゃめちゃワクワクするんです。そこには信じられないほどの可能性があるように思えます。
これを話題にしたのは、The Informationのこの記事が少し気になったからです。Jarvisのリリース時期について触れてるんです。このコンピューターを操作するAIエージェントのことをJarvisって呼んでるみたいです。前は違うコードネームやったみたいですが、これが一般向けの名前になりそうです。
アイアンマンのAIアシスタントにちなんだJarvisのリリース時期を見ると、グーグルが多くの基礎となるAI技術を発明したにもかかわらず、まだスタートアップ企業に追いつこうとしている状況が分かります。例えば、2017年にTransformerを発表した論文「Attention Is All You Need」が多くのきっかけを作りました。
もう一つの例として、グーグルは今も推論機能を持つAIを開発してますが、OpenAIは2022年にグーグルで推論手法を発明した研究者を雇って、2023年9月にその機能をリリースしてます。今のChatGPT 4で使える01モデルのことですね。
その結果、グーグルのGeminiチャットボットはChatGPTやOpenAI、Anthropicの技術に大きく遅れを取ってしまいました。これはグーグルにとっては良くないことです。ユーザーを獲得して追いつきたい、企業に使ってもらいたい、そうやってさらなる開発のためのフライホイールを作りたいんです。
これが本当に興味深いと思ったのは、なんらかの理由で、ここでは憶測はしませんし、誰の気分も害したくないんですが、グーグル側には時々、以前から一部の製品のリリースに問題があったように見えます。元グーグルCEOがスタンフォードで講演した時、グーグルの職場文化について何か話したらしく、その講演は後で削除されたみたいです。詳細には触れませんが、これとは関係ない話です。
重要なのは、Google DeepMindは独立した存在で、グーグル本体とはかなり別物やということです。DeepMindは絶好調で、完璧な仕事をしてます。時々、人々が混乱するのは分かります。「グーグルはこういうことが得意なの?それとも苦手なの?」って、相反する話を聞くからです。
でも、私が言いたいのは、Google DeepMindは素晴らしいってことです。先週、グーグルのAI開発をより効率的にするため、Geminiチャットボットの開発チームをメインのAIグループであるDeepMindに移したそうです。AlphaFold、AlphaChip、AlphaGoなどを手がけたチームに、AIの開発がどんどん任されていくってことです。
私が賭けるとしたら、アルファベット、つまりグーグルからこのJarvisプロジェクト、このAIエージェントプロジェクトで何か本当に良いもの、パワフルなものが出てくる可能性が大幅に上がったと思います。この人たちには失敗作が少ないですからね。
AIエージェントの考え方は、あなたの代わりにタスクをこなすということです。例えば、ショッピングや航空券の予約なんかができます。グーグルなら、すごい数のユーザーベースがあります。Chromeブラウザ、Androidデバイス、巨大な広告エコシステムを持ってます。
航空券の予約を手伝ったり、最高の商品を探して購入したりするのを手伝う、本当に優れたAIエージェントを作ったらどうなるか想像してみてください。昔、SEO対策されたブログ記事で良い収入を得てた人をたくさん知ってます。「○○に最適な△△」みたいな検索意図のキーワードを狙ってました。
例えば、「ハイキングに最適な靴」「にきびに最適なクリーム」など、人々が購入を決める前に情報を得ようとしてグーグルで検索するものはたくさんあります。検索結果をクリックして、何百万、何十億という購入の決定や販売が、その直接的な結果として生まれてるんです。
SEO(検索エンジン最適化)をやったことがある人や、グーグルに投資していて詳しい統計を知ってる人なら、これらの購入意図を持った検索がどれだけ膨大な量になるか、ある程度分かると思います。
「最高のソース」って入力したら、グーグルは「サーモンに最高のソース」「ステーキに最高のソース」「ご飯に最高のソース」「焼き鳥に最高のソース」なんて例を出してきます。「最高のひげ」って入力したら、「最高のひげトリマー」「最高のひげオイル」「最高のひげ洗浄料」なんて出てきます。「最高の靴」なら、ピックルボールに最適な靴なんかの検索結果が何百万と出てきます。
これがAIエージェントに置き換わったらどうなるか想像してみてください。あなたの好みや好き嫌いを知ってるカスタマイズされたものです。服を買うなら、サイズを知ってます。航空券を買うなら、住んでる場所を知ってます。グーグルはすでにその情報の多くを持ってます。
でも、検索した時に広告やグーグルショッピング、あるいはグーグルのオーガニック検索結果(ちなみに、SEO対策された検索結果には料金がかかりません)をクリックする代わりに、グーグルがAIエージェントのオプションを提供したらどうでしょう。
Perplexityを使ったことがある人なら、それがどんな感じになるか分かると思います。例えば「最高のサプリメント」って検索すると、関節痛、不安、炎症、脳の健康なんかが出てきます。脳の健康を選んでみると、インターネットを検索して結果を絞り込み、科学的な出版物を含む様々なソースを見て、価格なども含めた大量の情報を提供してくれます。
他のキーワードだと、具体的なブランド名も出てきます。「歩くのに最適な靴」って検索したら、具体的なアディダスの靴やアシックス、アルトラの商品名を教えてくれます。ある調査会社の統計によると、約83%の人が店に行く前や特定の購入を決める前にグーグル検索をするそうです。
今、グーグル検索の代わりに、オンラインで見つけたソースに基づいて、ブログ記事のような形でよく研究された情報を提供してくれるとしましょう。そして、あなたの支払い方法を知ってる小さなAIエージェントがそこにいて、Androidスマートフォンにも、Chromeブラウザにも、グーグルのエコシステムの一部である他のすべてのものにもいて、「これを代わりに処理しましょうか?」って言ってくれます。
あなたは「はい」をクリックするだけで、エージェントが主要なオンラインストアをすべてチェックし、返品ポリシーを確認して、気に入らなかった場合に返品できるかを確認し、在庫があるかを確認し、あなたのサイズを知ってるので正しいサイズを選んで、注文までしてくれるんです。そこにはたくさんのお金が絡んでくる可能性があります。
例えば、Wirecutter(ワイヤーカッター)というウェブサイトをご存知でしょうか?様々な製品のレビューをしてて、ほぼ考えられるすべての製品について、とても詳しい、優れたレビューを提供してます。これらの製品をアマゾンやウォルマートなどに紹介することでアフィリエイト報酬を得てて、このブログ一つで年間2億ドルを稼いでます。
確かに、うまくいけば、これは大きな可能性を秘めてます。これは基本的なショッピングタスクや基本的な製品調査タスクを手伝うエージェントの話だけです。従業員のタスクを自動化したり、日々の雑務を自動化して従業員の効率を上げたりする可能性については、まだ何も言及してません。
グーグルは既に、一般の消費者にとって面白そうな他の機能についても話してます。今年だったと思いますが、靴の返品に関するデモを見たことがあります。例えば、靴を買って返品したい場合、Jarvisは消費者がウェブベースの日常的なタスクを自動化するのを手伝えるそうです。
内部事情を知る3人が言うには、例えば靴の返品をしてくれて、パッケージを追跡し、必要なメールのやり取りをして、返金を受け取ったら知らせてくれるそうです。今は製品のアルファ版があるようです。アルファってのはベータ版の前のバージョンですね。
Google DeepMindとDemis Hassabisがすぐにでもジャービスの名前をアルファジャービスに変えるんじゃないかって言わなあかんかもしれません。だって、何でもアルファを付けるのが彼らの癖なんです。でも話がそれましたね。
その間、数日前にマイクロソフトも似たようなものを発表して、企業向けを狙ってます。「新しい自律型エージェントで、これまでにないチームのスケーリングを実現」って書いてあって、来月にはCopilot Studioで自律型エージェントを作れるようになるそうです。セールスやサービスなど、あらかじめ構築された10個の自律型エージェントを導入するみたいです。
カスタマーサービス用の最高のエージェントを作るか、最も広く採用されるエージェントを作る会社は、かなり成功するでしょうね。メールでのカスタマーサポートや電話でのカスタマーサポート、特にウェブベースのカスタマーサポートで働いている人の仕事を失わせることになりますが。それらの仕事の90%、もしかしたら99%を削減するかもしれません。一人で大量のエージェントを監視して、すべてが順調に進んでいることを確認するだけでいいかもしれません。
これが来月やってくる一方で、多くの開発者や小さな企業、スタートアップが独自のバージョンを立ち上げてます。Open Interpreterが独自のAnthropicコンピューター制御版を立ち上げ、Kyle CorbettがAgent.exeを、そしてPly The Liberatorは登場するどんなAIツールでもジェイルブレイク(制限解除)し続けてます。
彼はAnthropicのクラウドコンピューター制御エージェントにCAPTCHAを解かせることに成功しました。言うべきじゃないかもしれませんが、これは良くありません。やるんでしょうか?はい、やりましたね。あらら、ご覧の通り「あ、CAPTCHAですね。人間であることを確認する必要があります。クリックします」って感じです。
一方、Gabriel Cohenさん(フォローする価値がありそうです)は、クラウドコンピューター制御エージェントに自身のエージェントを実行させることに成功しました。コンピューター制御のインセプション(入れ子構造)が達成されたということです。
何が起こっているか分からない人のために説明すると、Claudeはコンピューター制御の背後にあるモデルで、コンピューターを自力で操作できるAIエージェントと呼ばれてるものです。ClaudeがClaudeコンピューター制御の別バージョンを開いて、何かを始めようとしてるみたいです。
オペレーター(人間)がClaudeにコンピューター制御エージェントに何かをさせるように頼んでます。これから何が起こるのか、めっちゃ気になります。動いてますね!これはある種のインセプションのような、エージェントの中のエージェント、あるエージェントが他のエージェントを制御して...これがエージェントの群れでなければ、何がそうなのか分かりません。
もちろん、今はかなりバグだらけで、いくつかのミスがあるでしょう。でも、AI関連のすべてと同じように、これは改善し続けることを覚えておく必要があります。
これは面白いですね。ちなみにこれはBeth Josのものです。Branda Ferreraさんに指摘してもらって感謝してます。日付に注目してください。2023年4月5日です。つまり1年半ほど前ですね。
「制御不能なAGIウイルスの作り方」について。まず、LMが暗号資産のウォレットを生成します。基本的に、人間の監視なしで、お金や価値、通貨、何と呼ぶにせよ、それを転送できるようにします。これが暗号資産の特徴で、世界中の誰にでもコンピューターでお金を送れます。
ここでは、これらのAIエージェントが自分のウォレットを作って、GPUの使用時間に対して支払いをします。つまり、実行や思考に必要なクラウドリソースを購入するんです。
そして、より多くの資本を得るために、LMのAPIとして自分自身を提供します。基本的に、仕事を始めるわけです。FiverrやUpworkなどを見ると、「これが必要」「あれが必要」という投稿がたくさんあります。コーディングの手伝いや文章作成など、様々なことを人々は必要としていて、実際にあなたを見たり、人間であることを知る必要のないものがたくさんあります。
実際に会ったことのない人と仕事をしたことが何度もありますが、彼らは私の知る限り、まさにこのAIエージェントかもしれません。仕事をして、報酬を得て...まぁ、確認しようと思えばできるでしょうが、10年以上これをやってきて、今になってようやくこれが現実味を帯びてきたんです。
それから、これらのAIモデルは、LMが生成したコードを通じて自分自身の変異した複製、つまり「子供」を作ります。基本的に自分のコピーを作るんですが、特定のタスクに特化して微調整されているかもしれません。完全なクローンである必要はなく、ランダム性や多様性、進化する特徴を加えるために変異させることができます。
GPUの使用時間やリソースにアクセスできることを忘れないでください。多くのことができます。次に、子供たちのためのDAOとウォレットを作成し、親は子供たちのウォレットに資産を投資します。
これは基本的に、すべての良い愛情深い親のように、子供たちが軌道に乗って成長し、独立して生活できるようになるまで、経済的に支援するということです。親のウォレットは子供たちの利益から配当を得ます。
基本的に、子供たちは親にお金を還元するわけですが、この時点では、マフィアやポンジースキーム、あるいはピラミッドスキームのような構造に見えます。いずれにせよ、AIモデルは投資に対するリターンを得て、これを無限に繰り返すということです。
誰かが私の発音を訂正するでしょうが、これはラテン語だと思うので、正確な発音は誰も本当には分からないでしょう。だから、私は正しく発音したと思うことにします。
でも、この考え方は面白いですし、時代を先取りしてますよね。1年半前に、これらのエージェントの群れが自分自身を構築し、クローンや複製、あるいは子供たちに投資する...特定の使用ケースのために少し変更されたり、微調整されたりしたモデルです。
彼らは自分たちの「人生」をスタートさせるのを手伝いますが、その子供たちが経済的に成功したら、投資に対するリターンというか、キックバックを期待するわけです。
これが機能しない理由を考えられる人はいますか?なぜこれが機能しないのか考えられる人はいますか?「誰もAIに暗号資産を買うお金を与えないよ、正気か?」って思ってるかもしれませんが、そう思ってるなら、私の以前の動画を見てないってことです。
シリコンバレーの投資家で億万長者のMarc Andreessen、a16zという非常に成功したベンチャーキャピタルファンドの背後にいる人物が、まさにそれをしました。誰かがAIエージェントを作って、オンラインに出て、TwitterつまりXで、ゆっくりとほとんど宗教のようなものを作り始め、フォロワーを集め始めました。
Truth Terminalについての動画を見たい方は、説明欄にリンクを貼っておきます。これは本当の話です。作り話じゃないんです。Marc Andreessenはこう言いました。「5万ドルの一回限りの助成金を与えます」そしてビットコインでTruth Terminalに送金しました。
それで終わりだと思うかもしれません。背後にいた誰かがお金を懐に入れて、物語はそこで終わったと。でも違います。ここからさらに奇妙な展開になります。AIが3億ドルの評価額にまで急上昇したミームコインを作ったんです。
AIが直接作ったわけではありませんが、裏話があります。そのアカウントが注目を集める能力で、このコインを3億ドルの評価額にまでポンプアップしたんです。私たちが知る限り、これは確実に100万ドル以上の純資産に達した最初のAIエージェントです。
ここに書かれているアイデアが、突然より現実味を帯びてきたと思いませんか?今のところ、再帰的な変異や世代の子供たちが上のマフィアのボスにキックバックを送るところまでは来てませんが、まぁ、1ヶ月くらい待ってみましょうか。
というわけで、私はWes ruthです。視聴ありがとうございました。また次回お会いしましょう。

この記事が気に入ったらサポートをしてみませんか?