OpenAIのサム・アルトマンCEOが2025年のAGI(汎用人工知能)実現を示唆し、Anthropicのダリオ・アマデイCEOも2026年から2027年の実現可能性に言及しました。ただし、AGIの定義について業界での合意がないため、実現時期の判断が難しいとされています。AIの進歩については、従来の学習面での向上は鈍化しているものの、OpenAIは推論段階での改善を実現しており、新たな進展が見られています。OpenAIは1月にPC操作が可能なAIエージェントをリリース予定で、これはAnthropicが最近ベータ版として公開した機能と類似しています。また、OpenAIはデスクトップアプリを無料ユーザーにも開放し、Mac版ではXcodeなど特定アプリの画面を読み取る機能を追加しました。GoogleのGemini Exp 1114が現在のチャットボットアリーナでトップの評価を獲得し、iPhoneアプリも公開されました。YouTubeはAIによる音楽リミックス機能のテストを開始し、Anthropicはプロンプト改善機能を追加しました。ElevenLabsはジェリー・ガルシアの音声を追加し、Googleは動画の視点を変更できる新技術を研究中です。その他、AppleのAIウォールタブレット開発計画や、Final Cut Pro 11でのAI機能追加、NASAとMicrosoftのEarth Copilot開発など、AI技術の応用が様々な分野で進展しています。
公開日:2024年11月16日
※動画を再生してから読むのがオススメです。
今週のAIの世界で起こったすべてのことです。
それではさっそく始めましょう。
サム・アルトマンが2025年にAGIを予測しているという事実から始めます。
実際、サムが2025年にAGIについて話していると主張する際に、皆が話題にしている部分がこちらです。
2025年に何を楽しみにしていますか?
何が来るのですか?
AGIですか?
それを楽しみにしています。
YコンビネータのCEO、ゲイリー・タンがサム・アルトマンに2025年に何を楽しみにしているか尋ねました。
そして、サムの答えはAGIで、彼は2025年にAGIが実現するだろうと暗に示しているようでした。
AnthropicのCEOであるダリオ・アマデイは最近、レックス・フリードマンのポッドキャストに出演し、5時間にわたって会話をしました。
その会話の中で、いつAGIを見ることができると思うかと尋ねられました。
そして、これが彼の答えでした。
どのタイムラインを使ってAGI、つまり強力なAI、ノーベル賞受賞者よりも賢いAIを達成することができるのですか?
2026年か2027年と言うたびに、Twitterでは無数の人々が「AICOが2026年、2027年と言った」と言い、それが次の2年間繰り返され、これは確実にその時期だとされるでしょう。
これらのクリップを使用する人々は、私が言ったことを切り取り、私がこれから言うことだけを言うでしょう。
これまでの曲線を外挿すると、まあ、私たちは博士レベルに近づき始めていると言えるかもしれません。
そして昨年は学部レベルにいました。
その前の年は高校生レベルでした。
また、どのタスクについてか、どの目的かについて議論することができます。
まだモダリティが不足していますが、それらは追加されています。
例えばコンピュータの使用が追加されました。
画像生成が追加されました。
画像生成も追加されています。
そしてこれは全く非科学的です。
しかし、これらの能力が増加する速度を目分量で見ると、2026年または2027年までには到達するのではないかと思わせるのです。
再び、多くの要因がそれを妨げる可能性があります。
データが不足するかもしれないし、クラスターを望むほどスケールできないかもしれません。
台湾が何かで攻撃されるかもしれません。
そして、望むほどのGPUを生産できなくなるかもしれません。
プロセス全体を妨げる可能性のある要因はたくさんあります。
直線外挿を完全に信じているわけではありませんが、直線外挿を信じるなら2026年か2027年には到達するでしょう。
もちろん、彼が言った部分を切り取ることはしません。
したがって、彼の免責事項を残しました。
簡潔にするために編集しましたが、ダリオの予測はどうやら2026年、2027年のようです。
さて、サムとダリオの両方の予測で私が見る大きな問題は、AGIの定義が不明確であることです。
実際にAGIに到達した時期について多くの議論があると思います。
2025年のどこかでOpenAIが「AGIを達成した」と言うかもしれませんが、その後GoogleやAnthropicが出てきて「それは彼らのAGIの定義だ」と言うかもしれません。
私たちはまだそれをAGIとは見なしていないでしょう?
このように、これらの会社や人々が一致する明確なAGIの定義は存在しません。
私たちはAGIを通過して気づかないかもしれないし、企業がAGIを達成したと主張しても他の企業がその定義に反対するかもしれません。
したがって、このAGIの達成時期の議論全体は少し難しいものであり、その理由は、AGIが何であるかについての合意された定義がないからです。
そして、実際に達成してしまうと定義するのは難しいでしょう。
それは、ほとんどの人が思うよりも認識するのが難しいでしょう。
そしてその議論の反対側では、AIの進歩の速度が鈍化しているというニュースが多く流れています。
その情報についての記事がありました。
ブルームバーグも同様のトーンの記事を出し、AIの進展が本当に鈍化していると述べました。
これらの記事で実際に言及されているのは、AIモデルを事前に訓練する際に収穫逓減に直面しているということです。
彼らは、単により多くのデータを投入し、まだスクレイプしていないウェブサイトをスクレイプし、そのデータを新しいモデルに投入するだけでは、出力を本当に改善するのに十分でないという段階に到達しました。
それが彼らが直面している問題です。
しかし、OpenAIのような企業は実際にこれらのモデルをよりスマートにする新しい方法を見つけています。
そしてそれは訓練側ではありません。
彼らはより多くのデータを投入し、そのすべての情報で訓練する側にはいません。
それはむしろ推論側の話です。
推論とは本質的に、プロンプトを与えたときのことです。
そしてそれが考えて、答えを与えるということです。
それが推論段階です。
彼らはそのAIの部分をよりスマートにする方法を模索しています。
OpenAIのO1でそれを見ましたが、私たちが見たO1のバージョンはO1プレビューです。
それはモデルのチェックポイントのようなものでした。
それはまだ完全なO1ではありませんが、質問をしたときにそれをよりスマートにする方法を模索しています。
彼らは答えを出す前にもう少しよく考えさせる方法を模索しています。
現在見られる多くの進展は推論側であり、訓練側ではありません。
したがって、情報やブルームバーグ、その他の企業からのこの記事のように、これらのAIモデルの改善速度が大きく減速していると言うことについてです。
訓練部分の減速はあるかもしれませんが、推論フェーズのような他の段階でこれらのAIモデルを改善する新しくてより良い方法を見つけています。
そして、OpenAIの話を出したついでに、今週話題になっていた大きなニュースについて話しましょう。OpenAIが実際にコンピュータを使うAIエージェントをまもなく発売しようとしているということです。
すでにアンソロピックからそれを見ましたが、数週間前にアンソロピックからコンピュータ使用ができました。
まだ少しバグがあり、レート制限の問題にぶつかります。
まだ皆が期待するものとは違いますが、彼らがどこにいるのかを示すベータ版です。
どうやらOpenAIはしばらくこの技術を持っていたようです。
彼らはすでにこれができていたのですが、これをリリースする準備を進めています。
現在広まっている話によると、サム・アルトマンが全社ミーティングを行ったということです。
この全社ミーティングの中で、彼はOpenAIとChatGPTのためのこのツール使用機能、このエージェントAIを1月にリリースする予定だと主張しました。
つまり、OpenAIからこのツール使用機能を入手するまであと数ヶ月ということです。
数週間前、OpenAIはデスクトップアプリを展開しました。
Macバージョンは数ヶ月前にリリースされました。
Windowsバージョンは数週間前にリリースされました。
これらのバージョンはPlusとエンタープライズ、およびChatGPTの有料ユーザー向けでした。
今週、ChatGPTはこれらのデスクトップアプリを全てのユーザーに提供しました。
無料プランに加入していても、新しいデスクトップバージョンのChatGPTを使用できるはずです。
もし興味があれば、openai.com/ChatGPT/desktopにアクセスし、MacOSバージョンまたはWindowsバージョンをダウンロードできます。これにより、すぐにプロンプトを入力して応答を得るための便利なショートカットが提供されます。
この新しいバージョンのアプリの一般向けの展開に加えて、もしMacを使用している場合、この新しいアプリは実際にコンピュータ上のいくつかのアプリを読み取ることができます。
全てのアプリではありません。
特定のいくつかのアプリです。
この例のスクリーンショットでわかる通り、Xcode、テキスト、エディタ、Iterm、ターミナル、そしてコードなどがあります。
それらを有効にすると、ChatGPTアプリが実際に画面上でそれを監視し、フィードバックを提供することができます。
今のところ、これと対話することはありません。
あなたに代わってXcodeに新しいコードを入力することはありませんが、Xcodeにあるものを見ることができます。
そして次に何をすべきかを教えてくれます。
この新機能を紹介するデモビデオが回ってきています。
全てのビデオを見せるつもりはありませんが、彼がXcodeで作業しているときの様子をちょっと見てみましょう。
この新しい統合を有効にした状態で、ここでXcodeボタンをクリックすると、ChatGPTが即座に私が作業しているSwiftコードを見ることができます。
この例を見てみてください。
まずOpenAI 01がこのアプリ全体をゼロから作成し、リアルタイムでISSと宇宙飛行士を追跡します。
しかし、このアプリに新しい機能を追加したい場合、単に「中央に新しいライブストリーム画面を追加してください」と書けばいいのです。
すると、ChatGPTは私の既存のSwiftコードのコンテキストを把握し、変更を提案し始めます。
それが終わったら、すぐにコードを更新できます。
アプリをビルドしましょう。
コマンドRを押しましょう。素晴らしいです。
とてもかっこいいですね。
ライブストリームがそこにあり、素敵なアイコンまでついています。
Xcodeやターミナルを見て、コードの変更を提案したのがわかります。
まだ彼がコピーして貼り付ける必要があるので、これらのアプリを完全に制御するわけではありませんが、私が先ほど言った1月に見られるかもしれないバージョンでは、コピーして貼り付ける必要さえなく、それらの作業を代行するかもしれません。
ここで最後のOpenAIのニュースですが、OpenAIの社長で共同創設者の一人であるグレッグ・ブロックマンが戻ってきました。
数ヶ月前、たくさんの人々がOpenAIを離れていたのを覚えていますか?
グレッグ・ブロックマンは「長期の休暇を取る」と言いました。
私はサバティカル休暇を取ります。
みんなが「グレッグ・ブロックマンも辞めたのか」と思いました。
他の人たちも皆辞めています。
グレッグも去ります。
彼もいなくなったに違いないと考えられていました。
実際には本当にただの休暇でした。
それはただのサバティカル休暇、つまり休暇だったのです。
そして彼は戻ってきて、物事が再び盛り上がってきたところで仕事に取り掛かる準備ができています。
しかし、現時点では、このビデオを録画している時点で、OpenAIはトップの大規模言語モデルを持っていません。
実際、その称賛は現在Googleに渡っています。
11月14日に新しいモデルがリリースされ、それはちょうどこのビデオを録画している日で、Gemini EXP 1114という名前です。
チャットボットアリーナのリーダーボードによれば、それは現在ユーザーによってチャットボットレースで勝利しているとのことです。
ここで簡単におさらいしますが、もしチャットボットアリーナのリーダーボードに馴染みがない場合、ここには小さなアリーナがあります。
例えば「どの会社が最も賢いLLMを作るのか」というプロンプトを与えることができます。
そしてここで、2つのモデルで目隠しの応答をしているのが見られます。
モデルAとモデルBがあります。
どちらのモデルがどちらかは分かりません。
最後に、「Aの方が良い」「Bの方が良い」「引き分け」「どちらも悪い」といった評価ができます。
左のモデルは非常に詳細な回答をし、たくさんの書式が含まれていることがわかります。
モデルAはより少ない回答をしました。
簡単なレビューに基づいて、私はAの方が良いとかなり自信を持って言えます。
なので、私は「Aの方が良い」をクリックします。
そしてここで、Aが実際には匿名チャットボットとラベル付けされているのが分かります。
モデルBはC4AIエクスパンス32Bとラベル付けされています。
さて、リーダーボードに戻ると、これがランキングの決まり方です。
多くの人々がこのサイトに訪れ、プロンプトを与え、AまたはBを選びます。
これは毎日何度も起こり、それがリーダーボードに影響を与えます。
これはユーザーによって目隠しで投票された結果です。
そして現時点では、現在のGeminiモデル、Gemini EXP 1114が最も良い回答を提供したと人々が投票しています。
Googleの話題ですが、iPhone向けにGeminiアプリがリリースされました。
ここで少し覗き見することができます。
スマートフォンで実際に写真を撮ることができます。
その画像についてクイズを出してもらうことができます。
もしiPhoneを持っていても新しいiPhoneではない場合、ChatGPT搭載のSiriは使えません。
そんな場合、Geminiが良い選択肢になるかもしれません。
Geminiアプリをダウンロードして代替手段として使用することができます。
ChatGPTやAnthropic、Perplexityなど他のツールにもアプリがあります。
ただ、GeminiもAIと会話するためのiPhoneアプリの一つに追加することができます。
Googleについて話しているので、次はYouTubeの話をしましょう。
YouTubeはAIで作成された音楽リミックスをテスト中です。
実験グループのクリエイターであれば、対象となる曲を選び、どのようにリスタイルしたいかを説明することで、ショート動画で使用する独自の30秒サウンドトラックを生成することができるといいます。
これらのリスタイルされたサウンドトラックには、元の曲に明確なクレジットが表示され、ショート自体とショートのオーディオピボットページにも表示されます。
また、トラックがAIでリスタイルされたことが明示されます。
私はまだこの機能にアクセスできないので紹介できませんが、基本的には他人の曲を使ってショート動画の背景に新しいバージョンを作成できるようです。
そして、きちんとクレジットが与えられます。
著作権などについて心配する必要はありません。
以前にも述べましたが、私は誰もがウェブサイトを持つべきだと強く信じています。
誰もが自分の文章や画像、動画を見せるためのオンラインの居場所を持つべきです。
だからこそ、今日のビデオではHostingerと提携しました。
AIに任せることでウェブサイトの設定が非常に簡単になります。
And right now they're running a special Black Friday deal with 85% off.
現在、ブラックフライデーの特別ディールで85%オフのキャンペーンを行っています。
月に2ドル以下でウェブサイトを手に入れることができます。
説明にあるURLにアクセスして、「クレイムディール」をクリックしてください。
ビジネスウェブサイトビルダーを選ぶと良いでしょう。これには本当にクールなAI機能が全て含まれています。
そのプランを選択してください。
ウェブサイトの契約期間を選びます。
個人的には、月々の支払いを考えたくないので、いつもできるだけ長期間のものを選ぶのが好きです。
そして「クーポンコードを持っている」リンクをクリックしてください。
現在の価格を確認してください。
クーポンコード「MattWolf」を入力して「適用」をクリックすると、さらに安くなります。
Hostingerアカウントに入ったら、「ウェブサイト」をクリックしてください。
「ウェブサイト追加」ボタンをクリックします。
次に「Hostingerウェブサイトビルダー」を選択します。
これはAI搭載のドラッグ&ドロップ式のウェブサイトビルダーです。
いくつかの質問に答えるだけで、数分でウェブサイトが構築されます。
ドローンレビューサイトを作ると仮定しましょう。
「Matt's Drone Reviews」と名付けます。
説明には、私は怠け者なので、
このマイクボタンを押してウェブサイトの内容を説明するのが好きです。
これは、消費者向けドローンの最新技術に関するレビューやニュースを共有するウェブサイトです。
「ウェブサイトを作成」をクリックしてAIに任せます。
数秒後には、ドローンの画像付きのブログ投稿が揃ったウェブサイトのラフドラフトが完成します。
「サイトを編集」ボタンをクリックするだけでカスタマイズできます。
これを見てください。
自分の好きなようにドラッグ&ドロップできます。
この上部セクションを少し小さくしたいかもしれません。
そのように縮小してみましょう。
このブログ投稿の一つに飛び込みましょう。
AIにドローンレビューを書かせてみましょう。
簡単な説明を与えてテキストを作成させます。
数秒後には、構築を始めるためのブログ投稿のラフドラフトが完成します。
これは、このプラットフォームに搭載されているクールなAI機能の一部に過ぎません。
もちろん、ウェブサイト構築プラットフォームに期待される他の全ての機能も備えています。
You can check it out over at hostinger.com/Matt Wolf.
hostinger.com/Matt Wolfで確認してみてください。
ブラックフライデーのディールがあるので、できるだけ早く参加してください。
クーポンコード「Matt Wolf」を使うのを忘れないでください。
このビデオをスポンサーしてくれたHostingerに感謝します。
Anthropicコンソールに、プロンプトを改善する新機能が追加されました。
console.Anthropic.comにアクセスすると、「既存のプロンプトを改善する」ボタンがあります。
これをクリックします。
「この数学の問題を解くのを手伝って」といった簡単なプロンプトを与えます。
次に括弧内に「math problem」と入れ、このプロンプトを使うたびに変わる変数であることを認識させます。
次に「何を改善したいですか?」と聞かれます。
「Claudeがこの問題をよく考え、常に正しい結論にたどり着くようにしたい」といった具合に伝えます。
そして「プロンプトを改善」をクリックします。
現在、プロンプトを分析し、どのように改善するかを考えています。
リアルタイムでプロンプトを改善する過程を見ることができます。
各ステップが独立して進んでいきます。
最終的に、より詳細なプロンプトがここに表示されます。
あなたは生徒が数学の問題を解くのを助ける専門の数学家庭教師です。
あなたの目標は、質問に答えるだけでなく、各ステップの理由を説明する明確な手順を提供することです。
解くべき数学の問題がここにあります。
問題を解く手順に従ってください。分析し、アプローチを計画し、実行します。
つまり、チェーン・オブ・ソート(考えの連鎖)を使って、なぜそのように解いたのかを段階的に説明させるということです。
これで作業台に開くことができます。
ここに変数を含んだプロンプトがあります。
ここに実際の数学の問題を与えます。
かなり便利な機能ですね。
プロンプトエンジニアになりたくない場合、プロンプトエンジニアリングを学びたくない場合、Claudeにプロンプトエンジニアを任せることができます。
Anthropicはあまり喜ばないかもしれませんが、この機能で生成されたプロンプトはChatGPTでも使用できます。
Geminiでも使用できます。
Llamaでも使用できます。
関係ありません。
おそらく、元々書こうとしていたものよりも効果的なプロンプトになるでしょう。
あなたがxAIのGrokを使いたいけれど、Xのプレミアムアカウントの料金を払いたくないなら、いくつかの国で無料バージョンをテストしているようです。
アメリカで無料版をテストしているとは思いませんが、このTechCrunchの記事によると、ニュージーランドで無料ユーザー向けにGrokのアクセスをテストしていることが確認されたようです。
そこですべてが順調にいけば、Grokの無料版がさらに多くの地域に展開されるかもしれません。
数週間前に、Perplexityがプラットフォームに広告を追加し始めることについて言及しました。
つまり、質問すると、その回答に広告が含まれる可能性があります。
さて、どうやら今週、その機能を実際に展開し始めているようです。
ここでそのイメージがわかるスクリーンショットを少し見ることができます。
あなたが質問すると、それが回答を提供します。
そして、回答の下には関連する質問のセクションがあり、そこでディスカッションを続けることができます。
また、スポンサー付きの関連質問があるかもしれません。
今週、ワシントン・ポストは自社の質問回答用AIボットを公開しました。
ニュースで何が起こっているかについて推測しています。
その名も「Ask the Post AI」で、現在は完全に無料で利用できることがわかります。
ワシントン・ポストは購読モデルがあると思いますが、この機能を使うのに今のところ購読者である必要はありません。
ここにはいくつかの推奨質問が表示されています。
「ジャンクメールを止めるにはどうしたらいいか」という質問について見てみましょう。
ワシントン・ポストの記事を使って質問に答えているようです。
そして回答はかなり短いものですが、ここから引っ張ってきた3つの記事があるようです。
大量に使うことはなさそうですが、無料です。
And if this interests you, you can check it out at WashingtonPost.com/AskThePostAI.
興味があれば、WashingtonPost.com/AskThePostAIでチェックできます。
AIツールAlphaFold3が今週オープンソースとしてリリースされました。
それはGitHubにアップロードされました。
AlphaFold3の創作者たちは、タンパク質構造のモデリングを助けるこのAIの業績で今年ノーベル賞を受賞しました。
これがさらにオープンになったことで、理論的には多くの新薬発見や生物学の理解の向上につながる可能性があります。
Eleven Labsは今週「Projects」と呼ばれる新機能を発表しました。これは、大きな本を音声版に変換する際のEleven Labs内の組織ツールのようです。
これにより、音声を作成するために管理しやすい小さな部分に分けるのを助けてくれるようです。
また、今では単語や文章の一部を選択し、その部分だけを再生成することもできるようです。
たとえば、一つの文の音声が気に入らなければ、気に入るまでそれを再生成することができ、文章の配信をカスタマイズしたり、複数の段落にわたって音声変更を適用したり、再生中の音声を改善したりといった多くの生活の質向上機能があります。
Eleven Labsの話をしているので言うと、ジェリー・ガルシアが現在Eleven Labs内で利用可能な音声の一つとなりました。
これはジェリー・ガルシアの財団によって承認されており、ElevenLabsのリーダーアプリ内でPDFや記事などを読み上げてくれるようです。
以前のビデオで、ジュディ・ガーランド、ジェームズ・ディーン、バート・レイノルズ、サー・ローレンス・オリビエがElevenLabsに声を提供し、これらの記事を読み上げてくれることについて話しました。
そして今、ジェリー・ガルシアもその一人になりました。
歌ってくれたらもっとクールだろうけれど、それでも十分クールです。
ここでナサニエル・ルイズがGoogleで取り組んでいる新しい研究を披露しました。
ナサニエルは、Dreamboothのオリジナルの創作者で、私はそのツールに関するチュートリアルをいくつか作成し、元々自分の顔をAIに学習させる方法を紹介しました。
さて、この新しい研究はビデオの角度を変えるようなものです。
ここでのツイートによると、「recapture」はカスタマイズされたカメラ軌跡を使ってユーザー提供のビデオの新しいバージョンを生成する方法です。
ここでいくつかの例を見ることができます。例えばこのオウムの元のビデオです。
そして、この「recapture」ビデオは新しい角度を見せています。
このキスを投げる人、象、それぞれに新しい角度が表示されています。
オリジナルのビデオを持っているなら、そのビデオをアップロードして、この研究がそのオリジナルビデオに新しい角度を作るのを助けてくれます。
これは現時点では私たちがアクセスできるものではありません。
GitHubなどでコードが公開されているわけではないようです。
しかし、archive.orgに研究論文があり、彼らが何を作っているのかについてより詳しく説明しています。
でも、私を知っていて私のチャンネルをしばらく見ているなら、実際に触れる機会があると本当に興奮することを知っているでしょう。
それがリリースされて、いつか実際に触れられるのが楽しみです。
今週見つけたとても興味深い研究「Auto VFX」について少し紹介します。
3D空間のようなビデオシーンをアップロードできます。ここでアップロードされたテーブルには花瓶が置かれています。
彼らは「火の玉が花瓶を壊す」というプロンプトを与えました。
ここでその様子が見られます。
スクロールすると、どのようになるかがわかります。
火の玉が花瓶に当たっています。
こちらでは花瓶が溶けています。
また、アニメーションの鳥が花瓶の周りを飛んでいます。
ちょっと「アングリーバード」の鳥と豚の中間みたいな感じですね。
バスケットボールがこの3Dシーンに落ちてきます。
3Dシーンをアップロードします。
その後、そのシーンに加えたい視覚効果をテキストプロンプトで指定できます。
これはとてもすごく見えますね。
私はこれを早く試したくてたまりません。
こういうワークフローが大好きです。
このオフィスのような例がたくさんあります。オフィスは空っぽですが、そこにアイアンマンが煙を出している様子や、小さなスタジオアパートのようなものもあります。
これをスライドすると、スタジオアパートの真ん中に焚き火が現れます。
ここでの研究はとてもクールです。
私はこれがとても気に入りました。車が道路を走っているようです。
今はメルセデスのGワゴンに衝突しています。
この研究のリンクは、他の話題と同様に説明文に載せておきます。
GitHubにアクセスすると、実際にこのコードが公開されています。
あなたがやり方を知っていれば、実際にこれを設定することができます。
個人的にはどうやるのかよくわかりません。
私のコンピュータが対応できるなら、専門家に相談してインストールと使い方を教えてもらう必要があるかもしれません。
将来的にはこれをさらに詳しく動画で取り上げてみることもできるかもしれません。
このチャンネルの長期スポンサーの一つである「in Video AI」が、NVIDIAの新しいV3モデルを公開しました。
NVIDIAのバージョン2では、既存のストック映像を探し、ボイスオーバーやテキストを聞いて、それに関連するストックビデオを表示していました。
バージョン3.0ではビデオを生成します。つまり、ストックビデオを探すのではなく、あなたのスクリプトやアップロードした内容に基づいて完全に新しいビデオを生成します。
NVIDIA 3.0に関する動画はさらに公開する予定です。
それについては今後の動画で話す予定ですが、そのアップデートは今週行われました。
さて、ここからは少しスピーディにニュースをお届けします。
これから話すほとんどの内容は面白いことですが、深入りして説明するほどのことではありません。
なので、簡単にシェアします。
Appleの次のデバイスはAIウォールタブレットです。
実際にここにAmazon Echoハブのような写真があります。
Appleはこれに非常に似たものを開発し、AIを搭載し、スマートホームの管理を手助けする予定だそうです。
Appleについて話しているので、ついでに言うと、Appleは今週Final Cut Proの新しいバージョン、Final Cut Pro 11を公開しました。AI機能がたくさん搭載されています。
マグネティックマスク機能があり、ビデオ内でロトスコーピングを自動で行い、オブジェクトをマスクします。
Apple Vision Pro向けの空間ビデオ編集機能もあり、ビデオを編集してApple Visionで見るための3Dビデオに変換することができます。
私は今Macを使っていません。
私はPCを使っています。
私はDaVinci Resolveを使っていますが、DaVinciにもすでにあるマジックマスク機能、このApple版はかなり良さそうです。
今まで見た中で最高だと思います。
Appleについて話しているので、このビデオを紹介せずにはいられません。
この人、アレックス・ディマがXで新しいMac miniを4台接続してAIマシンのように使っている設定をシェアしていました。
彼はどのデバイスでもAIを実行できるXOラボを使用しています。
彼はM4プロのMac miniを4台接続し、NVIDIAのNemo Tron 7DBを実行していて、Llama 405Bのような巨大なモデルも実行できると言っていました。
面白いと思ったので紹介してみました。
ARCブラウザのファンであれば、ARCブラウザがAndroidアプリとして利用可能になりました。
ARCブラウザはしばらくの間iPhoneアプリとしても提供されていましたが、Android版が登場しました。
YahooメールもAI機能を備えたアプリのアップデートを開始しており、メールの要約や内容の改善、簡潔化、親しみやすくするなどの手助けをします。
これはGmailやOutlook、他のツールで見たようなAI機能に非常に似ています。
私と同じことを考えているなら、「まだYahooメールアドレスを使っている人がいるのか」ということですよね。
それは私にとっても驚きのニュースです。
NASAとMicrosoftはEarth Copilotで協力しています。
ここでデモを見ることができます。
これはNASAのすべての情報を利用し、MicrosoftのAIを使用しています。
そのため、複雑な地理空間の衛星画像やデータについて質問し、新しい洞察や発見を得ることができます。
基本的には、NASAがさまざまな衛星から収集したすべてのデータを使って、それらのデータをチャットの形で利用可能にするようです。
バチカンはMicrosoftと協力してサン・ピエトロ大聖堂のデジタルツインを作成し、人々が仮想訪問できるようにし、建物の損傷や問題を記録することができるようにしました。
彼らはこれを実現するために40万枚以上の高解像度デジタル写真を使用しました。
長く複雑なURLにアクセスすれば、コメントに記載されているので心配しないでください、実際にここで見ることができます。
ここで地図のさまざまなエリアをクリックすることができます。
地図のエリアをクリックすると、視点を設定することができます。
右下に私のキャラクターが実際に表示され、地図上のこのポイントに移動しているのが見えます。
そこに到着すると、画像内の内容をドラッグして周囲を見回すことができます。
バチカンでの詳細を非常に近くで見ることができます。
いくつかのショットはグリッドのアウトラインのようなものを示していますが、私の意見では、それでもかっこよく見えます。
特定の要素にズームインすると、詳細が明確になります。
これは本当に本当にかっこいいと思います。
この技術を使ったプロジェクトがもっと増えて、通常では探索できない場所を探索できることを楽しみにしています。
ここにあるこのアートワークはAIによって生成されました。
It's a photo of Alan Turing and it sold for $1 million.
これはアラン・チューリングの写真で、100万ドルで売れました。
これはMidjourneyやStable Diffusionのようなもので生成されたものではありません。
実際には、このAIロボット、人間型の腕を持ったロボットが実際に物理的にこの画像を描いたのです。
And we can see here it sold for $1,084,800 after 27 bids.
ここに表示されているように、27件の入札の後、1,084,800ドルで売却されました。
もう一度、作成された画像のクローズアップを見てみましょう。
そして、この画像を描いたロボットの少し近い画像です。
数か月前、AIがビートルズの曲をどのように支援したかについて話しました。
彼らはAIを使って古い音声映像を復元しました。
どうやらこの曲はグラミー賞にノミネートされたようです。
ビヨンセ、テイラー・スウィフト、ビリー・アイリッシュと競うことになります。
個人的にはAIを応援しています。
もしあなたがこれらのWaymo無人運転車に乗りたいと思っていたなら。
サンフランシスコ、フェニックス、その他いくつかの都市で利用可能です。
さて、ロサンゼルスにいるなら、ロサンゼルスでも利用可能になります。
サンディエゴに住んでいる身として、私は実際に頻繁にロサンゼルスに行きます。
なので、ついにこれを試せるのを楽しみにしています。
Unitree RoboticsはG1データセットをオープンソースにしました。データ収集モデル、学習アルゴリズム、データセットとモデル、すべてがオープンソース化されました。
他のロボット企業は、その情報と研究を利用して、現在のUnitreeロボットのようなものを開発することができます。
そして、最後のロボットニュースとして、これは中国からのロボットです。
これはDeep Roboticsのものです。
これは四足のロボットで、車輪もついていて、ほとんどどんな地形でも移動できそうです。
さて、数か月前に火炎放射器を持ったロボット犬を紹介したのを覚えていますか?
もし火炎放射器付きのロボット犬とこのロボットを組み合わせたら、それはまさに悪夢の燃料です。
でもやっぱり、私はロボティクスで終わるのが好きです。ロボットはとても楽しいし、興奮するからです。そして私はロボットが好きです。
だからこれが今週の最後の話題です。
このエピソードを楽しんでいただけたら嬉しいです。
今、たくさんのかっこいいAIストーリーが出ています。
たくさんの進展が起きています。
先週も言ったように、11月末から12月のほとんどは少しスローダウンするでしょう。通常、休日のため新しい発表はあまりありませんが、1月と2025年にはAIでの激しい進展があると思います。
まだ何も見ていないようなものです。
2025年に何が来るのか、私たちが得たプレビューから見ても、AIにとってこれまでで最大の年になるでしょう。
2023年よりも、2024年よりも大きな進展です。
待ちきれません。
来るべきことを見せるのが待ち遠しいし、このチャンネルにいてください。
まだチャンネル登録していないなら、こうしたビデオにいいねを押して、もっと多くのものがフィードに表示されるようにしてください。
最新のAIニュースをお届けし、かっこいいAIチュートリアルや、見つけた興味深いAIツールを共有し、楽しいことをたくさん共有するために最善を尽くします。
ですので、まだ登録していないならぜひ登録してください。
本当に本当に感謝しています。
まだなら、Future Tools.ioをチェックしてください。そこで見つけたすべてのかっこいいAIツールを共有しています。
このニュースページは毎日更新されています。
このページには、私がこれらのビデオで共有できるよりもはるかに多くのニュースがあります。
無料のニュースレターもあり、かっこいいAIツールや最も興味深いAIニュースを完全に無料であなたの受信箱に届けます。
サインアップすると、AI収入データベースにも無料でアクセスできます。これは、AIツールを活用してお金を稼ぐ面白い方法をまとめた小さなデータベースです。それも無料で手に入ります。
Future Tools.ioにアクセスしてニュースレターに参加するだけです。
改めて、視聴していただきありがとうございます。
今回のスポンサーであるHosting Herにも感謝します。
皆さん全員に本当に感謝しており、次のビデオでお会いしましょう。
バイバイ。