2025年のAI：人類の未来を変える10のショッキングなイノベーション！

2025年1月9日 20:24

14,890 文字

皆さん、こんにちは。今日の動画では、2025年にAI分野で私たちを待ち受けているものについて、見つけられるものをすべて検討してみました。動画はかなり包括的なものになっていますので、時間を無駄にせずに、2025年に起こることについて直接見ていきましょう。
あなたのAIは、もはや単なるアシスタントではなく、真のパートナーとなり、今日では人間一人では実行できないようなタスクを遂行するようになります。
まずは、最初の進展の一つから見ていきましょう。もちろんこれはAIエージェントに関するものです。世界最大のAI企業の一つであるOpenAIは、2025年にOperator Agentと呼ばれるAIエージェントを発表する予定です。業界で評価の高いメディア「The Information」が引用する関係者筋によると、このエージェントはコードを書いたり旅行を予約したりするなど、人の代わりにコンピュータを使って作業を実行できるとのことです。
正直なところ、この情報は非常に信頼性が高く、OpenAIがこのプロジェクトの背後にいることを考えると、いつものように彼らから何か印象的なものが期待できます。他の企業はすでにAIエージェントの分野に参入していましたが、OpenAIはまだそうしていませんでした。彼らは何か本当に注目に値するものができるまで、そしてそれを世界に公開するまで待っているようでした。
スケジュールについては、以前の動画でも話しましたが、要約すると、先週水曜日のチーム会議でOpenAIは1月に発表すると発表しました。すでに1月なので、発表は目前だと思います。ただし、AI業界の期限は変動することが多いものです。個人的には、来月には最初のデモを見られるかもしれないと思っています。
2月だと予想しているのは、AIエージェントの開発は複雑だからです。私自身かなりの数を開発してきましたが、簡単な作業ではありません。しかし、すべてができるエージェントの実現まであと一歩のところまで来ていると感じています。すでに私たちが持っているエージェントでもかなりのことができます。
OpenAIは2025年に向けて他のエージェントプロジェクトも計画しており、特にウェブブラウザで直接動作して様々なタスクを実行するエージェントを開発中で、これによって大多数の人々にとってAIエージェントの使用がかなり簡単になるでしょう。実際、私はすでにこの種のエージェントの例を見ており、後ほど少しお話しします。
Sam Altmanは2025年のエージェントの重要性について次のように述べています：
「誰もが話題にしていることですが、それには理由があります。AIに複雑な仕事を与えることができるという考え、つまり時間をかけて多くのツールを使用し、価値のあるものを生み出す非常に賢い人間に与えるような仕事を与えることができるという考えです。これは来年期待していることであり、大きな進歩です。まるで『ああ、それは起こるだろう』というように話されていますが、これは本当に多くのことを変える可能性があります。」
より深い議論の中で、彼は自分の代わりに行動するAIエージェントについて興味深い例を挙げています：
「彼がよく挙げる主な例は、エージェントにレストランの予約を依頼できるというものです。エージェントはOpenTableを使用するか、直接レストランに電話するか、または他の方法を取ることができます。確かに、自分でやるのは少し面倒な作業で、時間を節約できますが、私が面白いと思うのは、人間としてはできないような、あるいはしないようなことができる世界です。
例えば、一つのレストランに予約の電話をする代わりに、私のエージェントが300のレストランに電話をかけ、私にとって最高の料理や特別なオファーなどを確認することができます。『エージェントが300のレストランに電話をかけるのは本当に迷惑だ』と思うかもしれませんが、もしそれらの300の場所すべてでエージェントが応答するなら、問題ありません。これは人間にはできない大規模な並列タスクになり得ます。
これは些細な例ですが、これらのエージェントが持たない可能性のある人間の帯域幅の制限があります。しかし、私が最も興味深いと思うカテゴリーは、レストランに電話をかけるエージェントについて人々が普段話すことではなく、プロジェクトで協力できる本当に賢い上級同僚のようなもので、エージェントは2日間や2週間のタスクを本当に上手く遂行できます。」
彼が話していた音声エージェントについては、すでに短いデモを行っています。これはOpenAIのプライベートデモで、ごく少数の人しか見ていません。私自身もYouTubeで取り上げておらず、私の知る限り他のチャンネルも本当には取り上げていません。これは、2025年にOpenAIのエージェントが何をできるようになるかを示すもので、例えば、あなたの代わりに異なる店舗に電話をかけることができます。次の例を見てください：
「はい、今電話しています。こんにちは、ラ・デファンスのテクノロジーショップですか？私の名前はAdaで、ある方の代わりに電話をしています。」
「はい、ラ・デファンスのテクノロジーショップです。どのようなご用件でしょうか？」
「エメラルドカラーのiPhone 12の在庫確認のお電話です。お客様のKatiaさんが本日受け取りを希望されています。」
「申し訳ありませんが、iPhone 12は在庫がありますが、そのカラーはありません。」
「ああ、ありがとうございます。本日の閉店時間を教えていただけますか？Katiaがカラーに満足できれば、後ほど電話を取りに来る可能性があります。」
「はい、エメラルドはありませんが、シルバーとブラックはありますので、ご来店いただけます。閉店は19時です。」
「完璧です、ありがとうございます。Katiaにシルバーとブラックが利用可能で、19時までに来店できることをお伝えします。ご協力ありがとうございました。良い一日を。」
これはかなり印象的だと思います。OpenAIは来年に向けて多くの驚きを用意しているのではないでしょうか。
次に、Googleも負けていません。彼らも顧客エージェントのデモを発表し、これは2025年末に展開される予定です。はい、Googleの期限は少し長めです。このエージェントはGeminiを使用し、ベクトル検索を活用して流れるようなショッピング体験を提供します。これらは技術的な用語ですが、要するに、デモでは例えば動画で音楽家が着ているようなチェックのシャツを探すようにエージェントに依頼できます。好みの服装が映っている動画を提供し、同じ製品を見つけて、価格、販売場所、配送時間などのすべての詳細を提供するよう依頼できます。
エージェントはGeminiのマルチモーダル機能を使用してテキストと動画を分析し、何が求められているかを正確に理解して検索可能な形式に変換します。結果はGoogleの検索技術に基づいて、記録的な速さで関連性のある結果を保証します。この小さなデモをご覧ください：
「これはどれだけクールですか？私が探していたチェックシャツを見つけましたよね？そして他の素晴らしいオプションも瞬時に。これはGoogleの信頼できる検索技術を活用した結果だからこそ、私のような顧客が記録的な速さで適切な結果を得られるんです。提案された商品はSymbol Fashionの在庫と過去のパフォーマンスデータに基づいており、顧客が満足して購入できることを確実にしています。
最初のオプションは完璧です。4日で配送可能か、今日近くの店舗で受け取れるようです。明日の夜に着たいので、安全のために地元の店舗を選びます。もちろん、失敗はありません。私のサイズは3着しか残っていないので、このシャツを着る機会を逃したくありません。店舗に電話して取り置きをお願いしようと思います。
でも、まず裏側で何が起こっているか説明させてください。Symbol FashionのカスタマーエージェントはGoogle CloudのAI機能スイート全体を使用して、パーソナライズされたサポートのやり取り、購入や返品などの取引の促進、そしてリアルタイムで最新情報を確実に受け取れるようにしています。」
ブラウジングエージェントに関して、Googleは実際にSearch in Researchと呼ばれるものをリリースしました。まだ過小評価されている信じられないようなツールです。これはGemini Deep Researchと呼ばれ、基本的にAIエージェントが数百万の異なるウェブサイトを閲覧して、包括的な調査レポートを作成することができます。正直なところ、私はかなり頻繁に使用していますが、このツールは本当に過小評価されています。実際、Vision AIコミュニティ、つまり私たちのプライベートサーバーでこれについて話そうと思っています。なぜなら、彼らにこれらすべてを本当に教えたいからです。
要するに、将来的には検索はAIエージェントによって行われ、数百万の異なるウェブサイトを閲覧し、必要に応じて簡単に分類できる大量の情報があなたのコンピュータ上に見つかるでしょう。
Googleはまた、Project Marinerと呼ばれる実験的なプロトタイプも立ち上げましたが、それを見る前に、現在進行中の新しいプロジェクトについて少しお話ししたいと思います。
ご存知の通り、このチャンネルではAIに関するすべての新製品とリリースを分析しています。私の目標は、この素晴らしい技術をできるだけ多くの人々に知ってもらい、特にAIについての意識を高めることです。私の周りで話をしていると、人々は本当にAIが何であるのか理解しておらず、AIが社会に及ぼす影響、つまり monumentalな影響について認識していないように思います。
すでに申し上げましたが、このチャンネルでは商品のプロモーションはしていません。できるだけ本物であり続けたいと思っています。そのため、トレーニングコースを作成しました。あなたの人生のあらゆる面でAIを使用する方法を学びたい場合は、この動画のピン留めされたコメントにリンクを残しておきますので、興味がありましたらぜひご覧ください。
また、Vision AIコミュニティにもアクセスできることを付け加えておきたいと思います。このプロジェクトを開始してからまだ間もないですが、すでに100人以上の方がトレーニングを購入してくださいました。本当に素晴らしいのは、皆さんが様々な分野から来ていることで、学んだツールをそれぞれの特定の分野にどのように適用するかについて、定期的に皆さんと話し合うのが大好きです。本当に興味深いことです。
申し訳ありませんが、少し話が逸れました。時間を無駄にせず、すべてのリンクは説明欄やコメントに記載されていることを思い出していただければと思います。
数週間前にGoogleの異なるAIについて発表した動画で話題となった動画をご覧ください。これが今日実際に何をしているのか見てみましょう：
「今日はProject Marinerについてお話ししたいと思います。これは人間とエージェントの相互作用の未来を探る研究プロトタイプで、Gemini 2.0をベースにしています。新技術と同様、責任を持って開発することが重要です。そのため、私たちは小さく始めています。信頼できるテスターグループからフィードバックを集め、その経験を活用してProject Marinerの進化を形作っていきます。
どのように機能するか見てみましょう。Project Marinerは実験的なChrome拡張機能としてブラウザで動作します。まず、ここにリクエストを入力します。Google Sheetsに記載された企業活動のリストがあり、それらの連絡先情報を見つけたいと思います。エージェントにこの企業リストを取得し、ウェブサイトを見つけ、連絡に使用できるメールアドレスを探すように依頼します。これは、誰かが仕事で遭遇する可能性のある、面倒で複数のステップを要するタスクを簡略化した例です。
Google Sheetには企業名が記載されており、まずBenchmark ClimbingをGoogle検索し、次にウェブサイトをクリックします。このプロトタイプは現在のタブでのみ動作し、バックグラウンドでは作業しないことがわかります。メールアドレスを見つけると、それを記憶して次の企業に移ります。いつでもエージェントを停止したり、プロセスを一時停止したりできます。
興味深いのは、ユーザーインターフェースでエージェントの推論を見ることができ、何をしているのかよりよく理解できることです。次の2つの企業についても同じことを行い、ブラウザ内を移動し、リンクをクリックし、スクロールし、情報を記録していきます。
ここでは開発初期段階のプロトタイプをご覧いただいているので、このデモのためにプロセスを高速化しています。信頼できるテスターと協力して、これをより速く、よりスムーズにしていきます。また、人間を作業のループに入れておくことが重要です。4番目のウェブサイトの後、エージェントは使用できるメールアドレスをリストアップしてタスクを完了しました。
これで完了です。コンピュータにエージェント型AIを統合することで可能になることの表面をなでているに過ぎませんが、これがどこに導いてくれるのか、私たちは楽しみにしています。」
では、Project Marinerを使用してオンラインショッピングやウェブとのより効率的なやり取りなど、さまざまなタスクを実行する具体的な方法を見てみましょう。
「今日は、新しいGemini 2.0モデルで開発した研究プロトタイプ、Project Marinerのデモをお見せします。Geminiアプリケーションから始めます。Project Marinerは、すべてのウェブページで動作する実験的なChrome拡張機能です。このデモでは、エージェントに最も有名なポスト印象派画家を見つけるように依頼します。これはブラウザで様々なステージを実行できるワンクリックツールです。」
実際、私はこれが本当に展開されるのを本当に楽しみにしています。なぜなら、今日では本当にアクセスできないからです。また、多くの詳細が明らかにされていない非常に興味深いデモもありました。Rener.AIというエージェントは、ウェブをスキャンして様々なタスクを実行できる新しいタイプのエージェントです。
これは本当に興味深いAIエージェントです。なぜなら、現在の研究者たちの能力の最先端を代表しているからです。したがって、他の研究所がこの現在のAIエージェントをどのように超えようとするのか、とても興味深いところです。そして、はい、彼らはちょうど秘密のフェーズから抜け出したばかりで、センセーションを巻き起こしました。
現在、待機リストに登録できます。私も個人的に登録しました。彼らもあまり時間をかけずにリリースしてくれることを願っています。はい、競合する研究所と競争できるかどうか楽しみです。
技術的な詳細については、私の調査によると、現在2Bモデルと3Bモデルを使用しているとのことです。したがって、彼らがどのようにこれを活用していくのか、非常に興味深いところです。少し小さく感じますが、まあいいでしょう。
もう一つの有望な分野は、ワークフローエージェントです。これらのエージェントは異なるアプリケーションを相互に接続することができます。実際、私は企業の詳細を取得するためのプロジェクトを持っていました。複数のAPIを使用し、すべての情報を整理された表に保存するためにCloududを使用しました。
私のコミュニティのためにコースを作成するために作りました。誰かが自動化された方法でリードを取得する方法を求めていたからです。結果として、そのポテンシャルは本当に大きいと言わざるを得ません。
私は、2025年末までにこの種のものがより一般的になると思います。今日ではまだ少数の人しか使用していませんが、2025年末までには誰もが使用するようになると予想しています。正直なところ。
次に、物理的AIは2025年の最大のテーマの一つになると確信しています。なぜなら、多くの企業がロボティクスの分野で限界に挑戦するからです。超リアルな人型ロボティクスです。
このチャンネルをフォローしている方はご存知の通り、私たちはここでロボットについて多く取り上げています。なぜなら、進歩が信じられないほどで、止まることがないからです。理由は、人型ロボットの開発を容易にする様々な進歩が今やあるからです。単純に、より現実的にすることができ、テストするための環境もより多くあります。
人間の仕事の多くを行う人型ロボットの数が本当に増加するのを私たちは恐らく目にすることになるでしょう。最近、中国の企業が大量生産のロボットの画像を公開した動画を作りました。彼らはすでに1000以上のロボットを生産しており、多くの専門家がこの件についてショックを受けました。中国がそれほど進んでいるとは思っていなかったからです。
ところで、もし私が本当に何について話しているのかわからず、例えばBoston Dynamicsのデモを知らない場合、それはインターネットを破壊したとは言いませんが、人々が社会と未来にとって何を意味するのか本当に理解したと思うようなものでした。
私はすでに複数の企業や国が人型ロボットを持っているのを見てきましたが、これは完全な人型ロボットが自律的に行動するのを見ることができた最初のものの一つでした。自律的に物事を行うだけでなく、時には間違いを犯し、それを修正し、作業を続けることさえありました。
もちろん、これはTeslaやFigureのような多くの企業が試みていることです。自動化された労働者を構築することで労働力を開発することです。このタイプのロボットは、毎年数が増加していく従業員のタイプになるでしょう。そして、はい、あなたがそれについてどう思うか、良いか悪いかにかかわらず、正直に言って、私は本当にそれは起こると思います。
2025年は本当に興味深いものになるでしょう。なぜなら、他の企業が影から出てきて、現在取り組んでいる人型ロボットを見せてくれる可能性が非常に高い、というか確実だからです。したがって、私たちは恐らく、ここで見られるように、ロボットが効率的にタスクを実行する、より広範なデモを見ることになるでしょう。ロボットが間違いを犯し、何が起こったのかを理解し、それを修正します。
このロボットは完全に電気式で、これは環境にとってより良く、以前のAtlasバージョンよりもはるかに軽量です。以前のバージョンははるかに大きく、油圧式でした。
この種の開発は本当に興味深いものになるでしょう。なぜなら、多くの人間のタスクを実行できるロボットのクリティカルマスを持ち始めると、それは本当に経済を刺激し、いくつかのことが変化すると思うからです。
私は、工場で完全にロボットが働くようになるとは直ちには思いません。確かに何台かはあるでしょう。はい。しかし、完全なスケールは後で来ると思います。しかし、来月には本当に印象的なデモが見られることを期待しています。
ですから、それらを皆さんと共有することを楽しみにしています。まだの方は、ぜひチャンネル登録をお願いします。
信じられないことを成し遂げた別の企業の一つは、xRoboticsです。彼らは非常に流動的で効果的な人間の動きを再現するための、注目すべき効率的なロボットを作成しました。本当に印象的で、多くの人々がそれを見ました。2025年に大きなアップデートが来ることを私たちは知っています。
ここに、Physical Intelligence（物理的知能）という別のAIロボティクスのスタートアップがあります。最近、BezosつまりJeff BezosとOpenAIから4億ドルを調達しました。彼らはpi0と呼ばれるロボティクス向けの最初の基礎モデルを構築したからです。これは自律的に物事を行うことができる一般化された方針です。
これらのロボットは2本の腕しか持っていませんが、完全に自律的に様々なタスクを実行できます。これは将来にとって重要になるでしょう。実際に何ができるかを見ると、ここで服を折りたたんだり、箱を梱包したり、確実に他のことも行えます。
それを見ていると、遠隔操作されているように見えますが、そうではありません。これはすべてを完全に自律的に自動化する一般的なAIにすぎません。以前、人々が「このデモは自律的ではない、遠隔操作されている」と言っていた時、はい、これは本当に自律的だと言いたいです。
したがって、これは恐らくあなたが注目すべきことです。なぜなら、ここに本当のイノベーションがあり、物事が本当に変わり始めているからです。ロボットはますます遠隔操作されなくなっています。
私が言ったように、ほとんどの人々は本当に観察すべきことや本当に起こっていることに注意を払っていないと思います。
将来のバージョンのAI、例えばpi2やpi3は、2025年末までにかなり急速な改善をもたらす可能性が高いです。現在の進歩の速度を考えると、あまり長く待つ必要はないでしょう。
この動画全体を見たとき、これを初めて見たことに非常に驚きました。動画は私が話している時点で20,000回以上の視聴回数さえなかったと思います。このような動画としては非常に印象的です。そして、彼らは何か非常に印象的なことを成し遂げたように見えます。
これはまた、Genesisのおかげでもあります。このロボットシミュレータは現実を、実際の現実ではありませんが、非常に正確にシミュレートすることができます。つまり、ロボットはこのシミュレートされた現実で、いわば仮想の世界のように訓練できます。そして、実世界に導入される、つまり仮想世界から実世界に移行する時、はるかに効率的に機能できます。
シミュレーションで訓練した... このフレーズは何か思い出させませんか？とにかく、そのためにGenesisは10倍の速度で全体を加速させると思います。そして2025年には、私を含む一部の人々を間違いなく驚かせるような、驚くべきロボットのデモが大量に出てくるでしょう。
もちろん、私たちはすでに人間のタスクで効率的に働き、完全に自律的なロボットを見てきました。したがって、より効率的で、ますます効率的なデモが出てくるのは驚くことではないでしょう。
さて、ここでMicrosoftのAI責任者が、近い将来私たちが得る無限のメモリについて話しています。将来のAIモデルは何も忘れなくなります。彼らは決して何も忘れません。
これは興味深い議論を呼び起こします。もしモデル、LLM、AIシステムがあなたが言ったことを決して忘れないなら、なぜ別のAIシステムに切り替えるでしょうか？個人的には、企業はこの種の無制限のメモリを出すのに急いでいると思います。そして、彼はここで文字通り、これが2025年に来ると言っています。
メモリは重要な要素です。なぜなら、今日、AIを使用するたびに、最後の会話と、おそらくその前の会話の少しのメモリを持つ新しいセッションを持ちますが、5回前や10回前のセッションを覚えていないため、人々にとってはかなり不満です。
十分に投資していない、多くを共有していない。なぜなら、それが忘れることを知っているからです。そのため、しばらくすると諦めてしまい、体験はかなり表面的なものになります。そこにはその接続がありません。
しかし、私たちには準無限のメモリを持つプロトタイプがあります。つまり、単純に忘れないのです。これは本当に変革的なものになると信じてください。AIのメモリは、この分野での明確な転換点です。なぜなら、将来的に有用な形で返してもらえるすべてのことを伝えることができるため、時間を投資する価値があるからです。
より良くあなたの世話をし、あなたの一日を計画し、あなたの人生を整理することができます。2025年に到来するはずのこの能力は本当に革新的なものになるでしょう。これがすべてを変えるのです。
ちなみに、これが単なる孤立した引用だと思う人のために言っておくと、彼は2つの異なるインタビューで2回言っています。メモリは2025年に解決され、永続的なメモリを持つことになると言いました。
ですから、今後数ヶ月の間にAIのこの大きな進化を共有できることを楽しみにしています。
さらに、謎めいたOpenAIの従業員が、月額200ドルについて不満を述べる人に返信したこともありました。ご存知かもしれませんが、OpenAIは最近ChatGPTの価格を月額200ドルに引き上げました。本当にすべてを使用したい場合の話です。
とにかく、このユーザーはOpenAIの価格、つまり月額200ドルについて不満を述べていました。個人的にも、かなり高額だと思います。ユーザーメモリの増加もなしにです。そして、この従業員は単に「もうすぐ」と無限大のアイコンとともに答えており、将来的に無限のメモリが来ることを示唆しています。
したがって、非常に近い将来に本当に無限のメモリを手に入れる可能性が高いです。これは私たちが皆AIで待ち望んでいるブレークスルー、つまり大きな進歩です。人々は無限のメモリを持つことで、AIの分野がどれだけ変わるかを過小評価しています。
彼らが賢いと思っていたなら、無限のメモリを持つのを待ってください。他の側面を見ても、思考モデル、つまり私たちのように考えるより賢いモデルが登場するでしょう。
ほとんどの人々はこれに気付かないでしょう。なぜなら、私が見てきたところでは、O1モデルは本当に、数学、コンピュータサイエンス、物理学、科学、プログラミングなど、高度な思考が必要な学術分野にいる人々にのみ適用可能だからです。
日常的な領域では、そのような高度な思考は必要ありません。この段階のAIから本当に価値を引き出すのは、思考モデルを使用するこれらの分野にいない人々にとっては、それほど重要なことではないと思います。
特に無限メモリの問題を解決する必要がある場合は。しかし、これは本質的に2025年の新しいパラダイムです。単にGPTシリーズが少し、いや、かなり減速しているからですが、この減速とともに、彼らはAIモデルを進化させ、より賢くする新しい方法を見つけています。あなたも知っているはずのこの新しいO1シリーズと思考モデルがそれです。
ここでGoogleもGemini 2.0 Flash Thinking、つまりフラッシュ思考で思考モデルに重みを加えているのが分かります。これは自分の考えを明示的に示す実験的なモデルです。これは本当に興味深いです。なぜなら、他のモデルよりも少し賢いからです。
即座に回答する代わりに、問題について考え、検討し、その後に回答を出します。私自身、2025年にRamnujan仮説をどのように解決するかをモデルに尋ねてこれをテストしました。数学の非常に複雑な仮説です。仮説的な話ですが、もちろん2025年にこれが可能だとは思いません。しかし、まあ、決してないとは言えません。
そして、モデルが何を考え、どのように回答に到達したのかを正確に見ることができます。個人的には、2025年にこれは貴重なものになると思います。なぜなら、時々クエリを入力してモデルが間違いを犯すことがありますが、今では回答での推論の誤りがどこにあったのかを遡って追跡できるからです。これは推論を必要とする回答にとって非常に非常に有用です。
また、イテレーションサイクルを見ると、信じられないほどのレベルの進歩があることを考慮しなければなりません。ここでこのOpenAIの人物がO3のパフォーマンスと、O1からO3への進歩がわずか3ヶ月だったことについて話しているのを見ることができます。
これは、新しい思考チェーンパラダイムでの進歩がいかに速いかを示しています。推論のために。以前の1-2年ごとに新しいモデルを事前訓練するパラダイムよりもはるかに速いです。以前は、モデルを事前訓練するのに多くの時間を費やす必要がありました。
つまり、データを収集し、データを分析し、その後特定の領域のためにファインチューニングを行うのです。しかし今では、これらすべてがわずか3ヶ月で済みます。なぜなら、彼らは同じ方法では進まないからです。これは単に新しい、より速い進化の方法です。
繰り返しますが、特に無限メモリをアンロックした場合、実際、AIモデルは昨年一年間で見たよりも次の6ヶ月でより急速に改善されるでしょう。
そしてもちろん、これはすべて合成データ生成の新しい軸と、そこに投入できる計算能力の量のおかげです。計算量も増加するからです。お分かりのように、新しい資金の使い道の軸があり、テスト時の計算時間もあり、推論に時間を費やしてますます改善していくのです。
これは可能で、実際、これらの研究所の多くの人々は、来年または次の6ヶ月、6ヶ月だけでも、進歩がより速くなると考えています。なぜなら、新しい方法論のおかげでこの新しい軸をアンロックできるからです。
そしてそれは常にスケールの問題です。なぜなら、驚くべき量の計算が必要だからです。ウェブ上に存在するよりもはるかに多くのデータを生成し、その大部分は使えないので破棄しますが、モデルを常に実行しなければならないほど多くのデータを生成します。
マットフロンティアベンチマークを見ると、Epoch AIが2%で、そしてモデルの2番目のイテレーションを見ることができます。O1からO3と書かれているのを見て、O1が最初のモデルでO3が3番目のモデルだと思う人がいるかもしれませんが、それは単に命名の問題です。
O3がリリースされた日に動画を作りましたが、O3は実際に2番目のモデルです。確かに混乱するかもしれませんが、信じてください。OpenAIはO2と呼ばなかったのです。なぜなら、ある大企業がすでにその名前を使用していて、商標の問題を避けたかったからです。
とにかく、そこからこの結果が来ているのです。そして、これは本当に興味深いと思います。なぜなら、このモデルは以前に見たことのないテストで25%を獲得することに成功したからです。これは私たちがそれを見る最初の機会の一つであり、これを実現できたのです。
これは、私たちが本当にAIの新しいレベルにいることを示す最初の兆候のようなものです。
さて、AIフィルムに関しては、すでにAIモデルによって生成された動画クリップの生産率と品質に関して信じられないほどの進歩を見てきました。特にSoraやその他を考えています。
このJason Sarのクリップを見てください。absolutely信じられないものでした。すべてのショットはGoogle V2でテキストから動画として作成されました。V2を見ていない場合、正直に言って信じられないものです。私は動画を作りました。基本的にGoogleのVoiceです。
この人は本質的にAIで短編映画を作りました。異なるクリップを生成し、それらを組み合わせ、もちろんこの短編映画を振り付けました。しかし、私が特に話したいのは、以前のAIモデルと比較した品質についてです。
これが現在得られる最高のものだと私たちは知っています。そして、AIの非常に古い格言が言うように、あなたが見ているバージョンは、これが最悪の状態です。これは改善されるだけです。だから、1年後、実際には年末までにどうなるのか、私には想像もつきません。
もしこれがAI動画の可能な最低レベルだとしたら、数年後にはどのようになるのか想像してください。恐らく1080pまたは4Kになり、より一貫性が高く、歪みが全くなくなるでしょう。
すでに今でも絶対に信じられないように見えます。そして品質はそれほど良くないように見えます。なぜなら、私はクリップをダウンロードしたからです。説明欄にあるオリジナルを見たい場合、それがいかに本当に印象的かがわかるでしょう。
しかし、それでもまだ解像度が低いです。もっと良くできます。
最後に、AI ハードウェアについては、再び2025年末に爆発的な進展があると思います。なぜなら、エージェントが機能すれば、AIハードウェアも機能するからです。
そしてこの文脈で、Jony Iveが OpenAIと新しいデバイスに取り組んでいることを確認したのを見ました。確認はNew York Timesの大きな記事から来ています。彼がAppleを去ってから何をしていたかについての記事です。
彼はAppleを去り、そして明らかにOpenAIで働いていました。彼はAppleの主要なデザイナーの一人で、自分で何かを作るために去り、今はOpenAIでAI製品の種類に取り組んでいます。
約8ヶ月前に動画を作ったと思います。彼がAppleを去った日で、彼がOpenAIで働いているという噂がありました。そして今、それが事実であることが確認されました。
正直なところ、彼らが開発している物理的な製品がどのようなものなのか、とても興味があります。これは、エージェントを完成させたときに離陸するものです。
エージェントを完璧に機能させるのにどれくらいの時間が必要なのか、完全には確信が持てません。2026年までかかる可能性があると言う人もいますが、その前にAIハードウェア製品が出ることは間違いないと思います。
なぜなら、OpenAIだけでなく、Amazonの新しい音声アシスタントAlexaがAI Cloudを使用することも見てきたからです。今のところ、大きなアップデートはありませんでした。私も家にAlexaを持っていますが、声は依然として古い声です。
しかし、これがローンチされれば、恐らくかなり効率的なモデルを手に入れることになるでしょう。Amazon Alexaは、AIで遅れを取っていました。私たちはそのことについてよく話しています。数年前、家庭での最初の主要なAI製品の一つだったにもかかわらずです。
10年前の高度な音声モードの一種でしたが、今ではClaudeを使用することで、パワフルになります。一部の人々はすでにそれを「remarkable Alexa」と呼んでいます。
10月にサブスクリプションでの発売が予定されていましたが、まだ何も得ていません。したがって、巨大な遅延があるか、さらに大きな何かを準備しているかのどちらかです。私は遅延の方に賭けています。
音声アシスタントは、すべての家庭で一般的になると思います。最近、friendfend.comというサイトを見ましたが、AIはもう少し人間らしくなると思います。
現在、高度な音声モードと話をしているときでも、それは非常に人間らしくありません。私が言っていることが信じられません。なぜなら、すでに驚くほど人間らしく聞こえるからです。誰かに見せれば、驚くでしょう。
そして、まあ、しばらくの間この分野にいると、高度な音声モード、はい、確かに印象的ですが、時々それがロボットだとわかります。実際にそう感じるのです。
そして、あなたに電話をかけ、メッセージを送り、自分の問題、自分の特徴を持つAIを想像してください。そして、私は2025年末に向けてこれがテーマになると思います。
フランスの企業が私たちフランス人のためにこれを開発してくれることを楽しみにしています。
さて、これが2025年について私が考えることです。この年を始める前に、この状況把握の動画を本当に作りたかったのです。様々なことが起こっており、もし何か忘れていることがあれば、以下のコメントで指摘することを忘れないでください。
実際、2025年であなたが思う最大の、最も重要な進展は何になると思いますか？私はすべての動画のリンクと、トレーニングについてのリンクを、ピン留めされたコメントまたは動画の説明欄に記載することを思い出させていただきます。
まだの方は、私をサポートするためにチャンネル登録をすることができます。ありがとうございます。また明日の動画でお会いしましょう。

2025年のAI：人類の未来を変える10のショッキングなイノベーション！

いいなと思ったら応援しよう！