AI最新ニュース: 新型秘密モデルがベンチマークを圧倒、AGIの到来が早まる、Googleの2025年AI計画、イーロン・マスク
8,500 文字
最初のニュースで見逃されてるかもしれへんのが、アーティフィシャル・アナリシスから最近発表されたArenaビデオのリーダーボードの件やねん。見てもらえたら分かるように、状況が大きく変わってきてて、中国がMinMax HuAIで1,092のELOと67%の勝率を記録して首位に立ってはるわ。先週リリースされたGemmo AIのMcKyモデルのMcKy 1がオープンソースのビデオ生成モデルをリードして2位に入って、Runwayが1,051のELOと61%の勝率で3位になってんねん。
これ自体もすごい話なんやけど、もっとびっくりする話があってな。最近アーティフィシャル・アナリシスが「Red Pandaって何やろ?」ってツイートしたんや。Arena画像リーダーボードを見たら、新しいモデルが世界を席巻してる状態になってて、そのモデルがRed Pandaっていうんやけど、驚くべきことに、これがどの企業のものかも分かってへんねん。
賢明なツイートによると、レッドパンダはアジアに生息してて、中国企業がビデオ生成で圧倒的な成果を上げてることから、BaiduかTencentといった中国のテック企業やろうって推測されてるわ。実際、最初に見たArenaリーダーボードでも、現在利用可能なテキストからビデオ生成モデルでは中国が首位やし、この推測は的確やと思うわ。
中国が新たにテキストから画像生成のモデルを出してきて、最近のBlack Forest Labs Flux 1.1 Proよりもかなり高いELOと79%もの勝率を記録してるんは、まさに圧巻やね。
ただ、個人的にはこれがOpenAIのモデルかもしれへんと思ってるんや。最近サム・アルトマンが、12月にGPT-5は出さへんけど、全ユーザーに向けてすごいツールを提供する予定やって言うてたやろ?フォトリアルな新しいテキストから画像生成がそのうちの1つかもしれへんねん。
でもやっぱり、これは中国から出てきたもんやと思うわ。米国が別の分野に注力してる間に、中国はいろんなことをやってきた。市場が調整される中でも、中国は信じられへんほど競争力を維持し続けるやろうね。米国がレースの口火を切ったかもしれへんけど、中国は猛烈に追い付こうとしてて、いくつかの分野では既に追い越してるんを見てきたからな。
これがMidjourney Version 7かもしれへんって噂もあるんやけど、それはちょっと分からへんな。どのモデルになるにせよ驚きやわ。まだ personally試してへんけど、既に高性能なFlux 1.1 Proよりもさらに良くなるとは思ってへんかったから、次の数日でどんなモデルか分かるのが楽しみやね。
2024年は失業率が高くて、レイオフも増えてる。今ええ給料もらってる仕事があっても、明日には失業する可能性もあるんや。怖い話やけど、自分と家族を守る方法があるんよ。それが複数の受動的収入源を作ることや。AIをスキルとして学んで使うことで、毎月追加で1万ドル稼ぐことができるんや。
Growth Schoolが3時間の実践的なAIトレーニングを提供してて、25以上のAIツールの使い方を教えてくれるねん。今すぐ説明文のリンクから登録できるし、このトレーニングはキャリアを伸ばしたい人にはマジでゲームチェンジャーやで。しかも通常は有料やけど、AI Gridの視聴者先着1万人は無料で受けられんねん。登録者には500ドル相当の追加リソースも無料でもらえるし、就職活動の戦略から給与交渉のテクニック、Excelの使い方、コンテンツ作成まで全部カバーしてるわ。
このAIトレーニングは技術者だけのもんちゃうで。金融、営業、マーケティング、HR、学生、起業家、どんな人でも役立つ内容やねん。Growth Schoolは世界中で100万人以上のスキルアップを支援してきたし、AIファーストの世界でトップ1%に入るチャンスやで。説明文のリンクからすぐに無料枠を確保してな。これが未来を確実にするスキルを学ぶ唯一のチャンスやで。Growth SchoolのWhatsAppグループにも参加して、定期的な重要なアップデートも見逃さんようにしてな。
iPhoneユーザーの方々に急いでお知らせやけど、AppleがiOS 18.1をリリースして、Apple Intelligenceが実装されたんや。来週くらいに来るって言うてたけど、もうここにあるわ。ただし、iPhone 15以降のモデルじゃないと、Apple Intelligenceの最高の機能は使えへんねん。今使ってるiPhoneをアップデートすれば、最新のAI機能にアクセスできるから、このビデオに含めとこうと思ってん。
コメント欄で教えてほしいんやけど、私自身iPhoneを持ってへんから、このモデルでどんな体験してるか知りたいわ。ちょっと変わった機能もあるみたいやけど、全体的にはかなり便利やと思うで。
それと、イーロン・マスクがAIについてインタビューで語ってたんやけど、彼の意見や発言を聞くのはいつも新鮮やわ。彼によると、AIは少なくとも年率10倍のペースで進化してて、1~2年以内には人間ができることは何でもできるようになり、その3年後には全人類の知能を合わせたレベルに達するらしいわ。
これについては前置きしとかなあかんのやけど、イーロン・マスクの予測は当たり外れがあるんや。テスラ・ロードスターや自動運転AIの件みたいに、かなりの遅れが出たこともあるわ。でも、AIが予想以上のペースで発展してるのは間違いない。たった2年前にGPT-3.5が出て、最近は Claude-01を使ってて、これがなんでそんなに大したもんなのか分かってきたところやねん。
3月のAbundance Summitでは、AIが年率100倍のペースで進化してて、2029年か2030年までには80億人の人間に匹敵する能力を持つかもしれへんって予測しはったけど、そのペースは今も維持されてるんやろうか?
「正確な数値化は難しいけど、少なくとも年率10倍のペースで良くなってるのは確実やね。4年後には1万倍、もしかしたら10万倍くらいになるかもしれへん。恐らく1~2年以内には人間ができることは何でもできるようになるやろうし、そこからさらに3年もすれば、全人類の能力を合わせたレベルに達するんちゃうかな。2028年とか2029年くらいやと思うわ」
レイ・カーツワイルによると、2029年っていうのは実は控えめな予測なんや。最近のピーター・ディアマンディスとのインタビューでも、2029年は妥当な線やって言うてはった。つまり、1~2年早まる可能性もあるってことや。Anthropicのセリエーサーなんか、強力なAIが2026年くらいに登場する可能性があるって言うてはんねん。
考えてみてや、2025年はもうすぐそこやし、2026年もすぐ後やろ?GPT-3.5から進化したAIが3~4年で登場するってことになるわけや。これはもう信じられへんくらいすごいことやね。
レイ・カーツワイルはまた、すぐに脳をバックアップして事故の際も意識を保存できるようになるって言うてはる。完全には同意できひんけど、彼によると、あと5~10年持ちこたえられたら、死ぬのがむしろ難しくなるらしいわ。脳も心臓もバックアップできるようになって、死ぬ方法を想像するのが難しくなるってことやね。
「人々は死にたくないんや。120歳まで生きたいかって聞くと、否定的な反応が返ってくる。だって、120歳の人に会ったことないやろ?95歳とか100歳の人は見たことあるかもしれへんけど、そうなりたくないって思うわな。でも、そんな風にはならへんのや。
95歳以上は生きたくないって言う人でも、95歳になって心身ともに健康やったら、明日死にたいかって聞かれたら、ノーって答えるはずや。もちろん、ひどい痛みに苦しんでる場合は別やけどな。今はいろんな臓器があって、どれか1つでも正常に機能せえへんかったら、選択の余地なく死んでしまう。でも、あと5年か10年持ちこたえられれば、望まない死を引き起こすような問題は全部解決できると信じてるわ」
イーロン・マスクのタイムラインはちょっと変やって言うたけど、レイ・カーツワイルも2029年にAGIが実現すると考えてはる。具体的な日付について考えてる人たちに言うとくけど、2029年は期限やで。今の10年は控えめな予測で、もっと早く実現するかもしれへん。
「1999年に30年後って言うたんや。スタンフォードで会議が開かれて、何百人も参加したけど、ジェフリー・ヒントンを含む80%の人が100年かかるって考えてた。でも彼も間違ってたって認めてる。1999年の時点で30年って言うてた人はおらへんかったけど、今の10年の終わりまでっていうのは控えめな予測で、もっと早まる可能性もあるんや」
イーロン・マスクの話に戻るけど、Xの資金調達について、400億ドルの評価額での交渉をしてるらしいわ。これはすごいことやで、Anthropicもこのレベルに近づいてるし。この評価額を見てAIがバブルやって思う人もおるかもしれへんけど、そうは思わへんな。
これはイーロン・マスクのブランド力を示すものやと思うわ。この400億ドルっていう評価額が本当なら、彼には信じられへんほどのブランド力と実績があって、将来の業績に期待されてるってことやろね。結局のところ、彼はOpenAIの立ち上げにも関わってたわけやしな。
報道によると、投資家との間で資金調達の交渉をしてて、評価額は約400億ドルになる見込みらしい。AIテクノロジー開発競争が激化する中での動きやね。この企業の評価額は数ヶ月前、60億ドルを調達した時点では240億ドルやったんや。新しい資金調達では数十億ドルを目指してて、それが400億ドルの評価額に上乗せされることになるわけや。
もちろん、これは評価額の話で、会社の一部を手放すことで得られる価値の話やねんけど、フロンティアモデルのトレーニングには膨大な計算能力が必要で、これは本当やね。実際、X.AIの世界最大のスーパーコンピューターの内部を見せる動画がすごかったわ。
OpenAIよりも他の多くの企業よりも大きいスーパーコンピューターを、比較的短期間で構築したんや。イーロン・マスクはこのスーパーコンピューターにさらに計算能力を注ぎ込んで、世界最大の計算工場を作ろうとしてる。前も言うたけど、計算能力の貧富の差が出てきて、これだけのGPUを手に入れる資金力のない企業は、独自のモデルトレーニングで苦労することになるやろね。
なんでイーロン・マスクがこんな高い評価額になるのか?それはこれらのチップが全然安くないからや。チップだけでなく、これらのGPUから出る熱を冷やすための液冷ラックやデータセンターのエネルギー供給など、データセンター自体にも数十億ドル単位の費用がかかるんや。これはもう大手企業しか参入できへん世界やね。
X.AIとイーロン・マスクだけやなくて、独自モデルをリリースしてフロンティアモデルのトレーニングを続ける可能性が高い企業として、Metaがあるんや。来年早々にLlama 4をリリースする予定で、自律的な機械知能を目指してるらしい。
MetaのAI担当VPがAnalytics India Magazineで語ったところによると、Llamaモデルが単に計画を立てるだけやなく、リアルタイムで判断を評価して、状況が変わった時に調整できるような方法を探ってるんやって。思考の連鎖を使うこの反復的なアプローチは、認識、推論、計画を効果的に組み合わせた自律的な機械知能を実現するというMetaのビジョンを支えてるんや。
これはほとんどの人が知らへんことやけど、Metaはオープンソースのリーダーとしてだけやなく、OpenAIのClaude-01が持つような思考の連鎖や、状況が変化した時に判断を変更・評価できるエージェント機能を持つ独自モデルも計画してるんやで。
MetaのAIチーフであるヤン・ルカンは、フランス語でAmiと呼ばれる自律的な機械知能システムが、人々の日常生活を本当に助けることができると信じてはるわ。これはAGIやASIの別の呼び方かもしれへんね。OpenAIは既に内部的に達成してる可能性が高いけど、それに取り憑かれてるみたいやしな。
2024年早々のLlama 4のリリースとMetaの計画モデルっていうのは、かなりクレイジーな話やけど、これがMetaの計画の全てやないんや。Metaの秘密のコードネームについて、ヤン・ルカンはこう説明してはる:
「人間の知能に似た知能を持つシステムを作りたいんや。それによって簡単に対話できるようになる。つまり、世界を理解し、世界がどう動くかを理解し、物事を記憶して、推論や計画ができる機械が必要なんや。これがMetaでAGIって呼ばれてるものの内部コードネームやけど、私はAGIって言葉が好きやない。だって人間の知能は全然汎用的やないからな。むしろ非常に特殊化されてる。だから人間レベルの知能を汎用知能って呼ぶのは間違いやと思うわ。
我々はAmi(フランス語で「友達」の意味)って呼んでるんやけど、それが適切やと思うわ。世界の仕組みを理解し、世界のメンタルモデルを構築して、世界を理解し計画を立てることができるシステム。永続的なメモリを持ち、目的を達成するために行動シーケンスを計画できるシステム。トレーニングなしで、一発で未知の問題に対する新しい解決策を推論し発明できるシステム。そして制御可能で安全なシステムや」
Metaは実は、GoogleとMicrosoftへの依存度を下げるために独自のAI検索エンジンも開発してるんや。FacebookのオーナーであるMeta Platformsは、OpenAIに追いつくためにAIを開発する中で、Meta AIチャットボットを使う人々に現在のイベントについて会話形式の回答を提供するウェブクローリング検索エンジンを開発してるんや。
これによって、現在Meta AIにニュース、スポーツ、株価の情報を提供してるGoogle検索とMicrosoft Bingへの依存度を下げることを期待してるらしい。これはマーク・ザッカーバーグCEOが、他の主要テクノロジー企業への依存度を下げようとする取り組みの一環やね。特にAppleについては、数年前にiPhoneアプリを通じた収益を得にくくなったことで痛手を負ってるんや。
iPhoneのApp Storeを通じた収益を完全に吸い上げるAppleのやり方は悪名高いわ。詳しくは話さへんけど、マジですごいことになってるんや。Metaはこのウェブクローリングの開発を約8ヶ月続けてきたらしいわ。このツールがいつリリースされるかは分からへんけど、Metaがどんな技術を開発してきたか見るのが楽しみやね。
他の企業も色々と開発を進めてて、2025年にはGoogleのProject Astraが準備できるらしいわ。AIが周りの世界を見て理解できる体験を構築してて、Project Astraはその未来の一端を示してるんや。2025年にはこういう体験を提供できるように取り組んでるらしい。
皆さんも多分見たことあると思うけど、有名なProject Astraについて簡単に説明すると、これはGoogleが考える高度な知能の未来像なんや。現在のAIみたいに会話して応答を得るだけやなくて、Googleの高度な音声モードにカメラが付いたようなもんやね。
AIとFaceTimeしてるような感じで、環境内のものを識別したり、環境について色々教えてくれたりできる。しかも環境内の特定のものがどこにあるか記憶する機能もあるんや。一人で暇な時とか、ソフトウェア開発のブレインストーミングしたい時、家の中で何か無くした時、片付けのインスピレーションが欲しい時なんかに、これは完全なゲームチェンジャーになると思うわ。
この技術は絶対にすごいもんになると思うけど、GoogleにとってはOpenAIも似たような技術を持ってるっていう問題があるんよね。OpenAIが市場に出す前に、この技術を提供できるんやろうか?AI業界では速度が何より重要やからな。Googleがどれだけ早くこれを展開できるか興味深いところやわ。
面白いことに、Googleの新しいコードの4分の1以上がAIによって生成され、エンジニアがレビューして承認してるって報告もあったわ。これによってエンジニアの生産性が上がって、作業のスピードも上がってるらしい。モデルが将来の開発サイクルの改善を支援するっていう、ゆっくりとした反復的なフィードバックループは、もう始まってるみたいやね。
プロンプトエンジニアリングに興味ある人に役立つ研究論文も出てて、「思考の連鎖の理論的理解:一貫した推論とエラーを意識した実証」っていう内容なんや。左側にある標準的な思考の連鎖では、プロンプトを与えて「これをステップバイステップで、この推論プロセスを使って」って言うんやけど、モデルが犯しそうな間違いや、実際に犯す間違いの種類は示してへんのやね。
これが標準的な思考の連鎖のプロンプトと、そこで犯される間違いの種類やけど、正しい道筋と間違った道筋を示す思考の連鎖の方が、実際にはパフォーマンスが高くなるんや。AIに何をすべきかだけやなく、何をすべきでないかも示すことで、大規模言語モデルの能力が向上するんや。間違った推論のステップを示すことで、そういう間違いを犯しにくくなって、より良い結果が得られるってわけや。
もし何かのタスクで苦労してるなら、「これはやめてな、これは間違った解決策やで」っていうのを、こういう推論ステップに基づいて示してみるのをお勧めするわ。そうすれば、AIがタスクを上手くこなせるようになるかもしれへんで。
プロンプトエンジニアリングって流行りもんみたいに思われがちやけど、マジで何度も問題に取り組んでて「こういう風にプロンプトしてみよか」って試してみると、「わ、モデルはバカなんやなくて、ただ俺の質問の仕方を理解してへんだけやったんや」って気づくことがめっちゃあるんや。
最終的に欲しい出力を得られた時は、まるで錠前を開けて金庫の秘密の組み合わせを見つけたみたいな感じやわ。だってそれを他のシナリオでも使えるようになるからな。
前にも話したけど、人工超知能(ASI)をどれくらいの価値があると思う?ソフトバンクのCEOである孫正義氏は、人間の1万倍賢い人工超知能が2035年までに登場すると言うてはんねん。不可能とは言わへんけど、その能力を考えるとめっちゃクレイジーな予測やで。
「人間の脳と同じレベル、それがAGI(人工汎用知能)の定義やけど、ASI(人工超知能)についてはみんな違う考えを持ってる。10倍賢いんか、100倍賢いんか。私のASIの定義は人間の脳の1万倍賢いっていうことや。それが10年後の2035年に来るっていうのが私の予測や」
ちょっと昔に戻って思い出してほしいんやけど、サム・アルトマンがAIチップを作るのに7兆ドル必要って言うた時のこと覚えてる?ソフトバンクのCEOが言うたことを聞くと、この評価額はむしろ小さく見えてくるかもしれへんな。
人工超知能には400ギガワットのAIデータセンター、2億個のチップ、9兆ドルの資本が必要になるって言うてはんねん。これはマジでとんでもない数字や。サム・アルトマンが発表した時は皆笑ってたけど、将来を見据えると、この投資要件はそんなに馬鹿げたもんやないって分かってくるわ。
「人類の1万倍賢い知能を作るのに、どれくらいのギガワットが必要なんや?私の予測では、400ギガワットのAIデータセンターの電力が必要になる。これはアメリカの総電力消費量より大きいんや。そして2億個のチップが必要になる。累積設備投資は9兆ドル。多くの人にとっては大きすぎる投資額かもしれへんけど、私は全然妥当な額やと思う。9兆ドルは大きすぎるんやなくて、むしろ小さすぎるかもしれへん」
今週のロボット関連では、Clone Roboticsっていうスタートアップが筋骨格系の胴体を発表して、めっちゃ高度なヒューマノイドの未来がどんなもんになるか垣間見えたわ。もう言葉では表現できへんくらいすごいもんやけど、こんなロボットが開発されるってことは、ターミネーターのシナリオも思ってたより近いんかもしれへんな。
このような研究は革新的やと思うわ。他の企業であんまりこういうヒューマノイドや胴体のロボット開発に取り組んでるのを見かけへんけど、エコシステムにとっては興味深い存在やね。同じ最終目標に対して違う視点を示してくれてるからや。