見出し画像

AIの進歩は止まらへん

15,172 文字

AIの進歩は止まらへんし、スピードも落ちてへんねん。Runwayっちゅう会社があってな、生成AIの画像と動画の分野でトップクラスやねんけど、ライオンズゲートと大型契約を結んだらしいわ。ライオンズゲートのテレビ番組や映画全部で、Runwayのモデルを訓練するんやって。
ハリウッドの連中もなんか思うところあるみたいやし、わしらもなんか思うとこあるし、みんなもいろいろ考えるやろなぁ。詳しゅう話したら、みんな気になるんちゃうかな。
それからな、OpenAIがO1モデルの使用制限を緩和したんや。新しいO1モデルめっちゃええで。でもな、世間には「センシエント(自己意識持ってる)」言うてる人もおるし、OpenAIは「違うわ」言うてるし。今日はそのへんの最新情報も話すで。
Sunnoっちゅうとこがな、新しいカバーソング機能出したんやけど、これがすごいねん。基本的な音やノイズ、自分の声でも、ポップスやオーケストラの名曲に変えられんねん。めっちゃ簡単に使えるし、楽しいわ。みんなにも見せたいくらいやわ。
それにな、家庭用ロボットが自分で世界モデルを構築しとるし、AIがゲームをもっとすごいもんにしようとしてるんや。もっとすごなるで、って。うわぁ、これ絶対AIやん。
人間のみなさん、今日は大きなニュースから始めていくで。Kevin、今日の大きな話題はRunway MLやな。この生成AI企業が、ライオンズゲートと大きな契約を結んだんや。
ライオンズゲートを知らん人もおるかもしれんけど、ハリウッドの大手スタジオで、毎年たくさん映画作っとんねん。今年はあんまりええ成績出てへんのに、なんでこんな時期に生成AI企業と儲け話するんやろ?
そやな、でも詳しい内容はあんまり明らかになってへんねん。ただ、Runwayがライオンズゲートの映画やコンテンツを使って、独自のAIモデルを作るっちゅうのは確かやねん。Kevin、これってAIとハリウッドの世界で大きな一歩やと思うわ。大手が未来に向けて一歩踏み出したみたいやな。
ネットで請願書作られてるの、もう想像できるわ。ライオンズゲートのファンの中には、AIに反対する人らもおるやろうしな。
そやな、こういう契約が来るのは予想してたけど、反発はかなりでかいかもしれんな。ゲーム開発者が生成AIツールを使おうとして批判された例もあるし、みんな怒るんちゃうかな。ライオンズゲートにとってはマイナスになると思う?
そやな、マイナスになるかどうかと、経済状況について話そか。Kevin、わしらも昔ハリウッドやLAでメディア制作の仕事したことあるやろ。今、業界の状況めっちゃ悪いねん。テレビやメディアのビジネス、最悪やわ。仕事なくなった人めっちゃ多いし。
ハリウッド・リポーターの記事でな、ライオンズゲートがコスト削減って言うてるんが面白いわ。みんなに知ってほしいんやけど、これ2つ重要なポイントあんねん。
1つ目は、多分こういう方向に進んでいくんやろうなってこと。すぐには大きな変化見えへんと思うけど、たぶんB-roll(補足映像)みたいなんに使われると思うわ。例えばドローン映像とかそんなんやな。
「ジョン・ウィック6」で、ジョン・ウィックが手を上げたら6本指あったりせえへんやろ。
タイトルシーケンスがそうなるかもな。ポスターにケアヌが溶けてるみたいなんあったら面白いわ。その場面、AIで作ったんちゃうか?って。
もう1つ重要なんは、これでめっちゃ批判が出ると思うねん。SAGとWGAとか、そういう組合が何か言うんちゃうかな。ライオンズゲートがこの素材の権利持ってるからな。スタジオがこの素材に金払って買ったんや。
たぶん「ジョン・ウィック」の監督に「これどう思う?」なんて聞いてへんと思うわ。Runwayの記事では「クリエイターの助けになりたい」って言うてるけど、これ作った人全員に「いいですか?」って聞いてへんと思うで。
タレントって言葉嫌いやけど、タレントの立場から言わせてもらうと、Gavin。わしも何回かカメラの前に立ったことあるけど、契約書にはだいたい「あなたの肖像権を永久に、知られてる宇宙全体で使う権利がある」みたいなこと書いてあんねん。まるで宇宙人が書いたみたいやろ?
そうそう、文字通り「宇宙全体で」って書いてあんねん。時空も入ってるかもな。
そうやって書くのは、こういうことのためなんや。キアヌ・リーブスみたいな大物はなんか条項入れてるかもしれんけど。ちょっと話それるけど、カリフォルニア州で新しい法律できたんや。Gavin Newsomが先頭切ってな。
AIプロバイダーが明確な許可なしに肖像権使うの禁止されたんや。許可するときは、法律の専門家か代理人が立ち会わなあかんようになった。これで、業界に入ったばっかりの人が搾取されるような契約書にサインせんようになるんやな。ええと思うわ。
でもな、Gavin、過去の契約はどうなんねん?「ジョン・ウィック」の場合、キアヌの肖像権使ってAIモデル作るやろ?でも、出来上がったもんが完全に別人やったらどうなんねん?動きや声は使うけど、ちょっと変えてるみたいな。そんときキアヌにどんな権利があんねやろ?
「ジョン・ウィック」の犬はどうなんねん?あの犬、オスかメスか知らんけど、どんな権利あんのかな。
そやな、それが大事な質問やな。全体的に見てな、これは大きな問題になると思うわ。多くの人が文句言い出すと思うし、ライオンズゲートがこの反発に対応できるかどうか分からんけど、明らかに決断したんやな。
そうやな、最初のドミノ倒れたみたいなもんやな。ジェンガのピースが抜けたみたいな。ゲームの例え何でもええけど。だってディズニーもフォックスもみんな真似するやろ。絶対この方向に行くわ。
ずっと注目していくで。みんなにも最新情報教えていくわ。でも、みんなはどう思う?この契約について。うちの聴衆はめっちゃ意見が分かれとんねん。Kevin、わかるやろ。
これにめっちゃ怒ってる人もおるし、それもわかるわ。仕事なくなるんちゃうかとか、クレジットどうなんねんとか、報酬はどうなんねんとか。全部もっともな心配やと思う。
業界の人も聴いてくれとるし、高いタワーの中で高いSonosスピーカーで聴いてる人もおるやろ。「ああ、これで利益上がるな」とか「クリエイターがもっと想像力豊かなもん作れるようになるな」とか思ってる人もおるやろ。
わしも正直どっちつかずやけど、めっちゃ注目してるわ。ジェンガの話やけど、たぶん酔っ払いのおっさんが持ってるジェンガやな。今のメディアエンターテイメント業界みたいなもんやで。
次の話題に行こか。OpenAIがO1について新しい情報出したで。O1の話したよな。見逃した人のために言うと、YouTubeチャンネルにO1の全解説動画あるから見てな。O1とO1ミニ、O1プレビュー、この2つが新しいモデルやねん。Kevin、今週新しい情報出たみたいやけど、めっちゃ面白いで。
特にな、OpenAIが「ほら、思ったより使えるで」って言うてんねん。サム・アルトマンがサンタクロースみたいに煙突から降りてきて、プレゼント詰め込んでくれたみたいやな。
そうそう。O1ミニ、多くの人が新しいモデルやと思てるわ。O1プレビューはGPT-4に付け足したみたいな感じやけど、O1ミニは全然違うもんみたいやねん。
O1ミニ、1日50回まで使えるようになったんや。前は1週間で50回やったのに、すごい進歩やな。わしはカーソルってプログラムで使ってるんやけど、めっちゃすごいで。もっと完璧なコードが書けるようになった。ベンチマークとかグラフとか、なんでもいけるわ。
毎日使ってるけど、AIのプラセボ効果かもしれんけど、めっちゃええわ。楽しんで使ってるで。
Kevin、ちょっと説明すると、カーソルってプログラムは前も話したけど、普通の言葉でコード書けるプログラムやねん。モデルがよくなるほど、コードもよくなんねん。Kevinが言うてるのは、今週まで使ってたGPT-4より、O1ミニのほうがめっちゃ良くなってるってことやな。
そう、めっちゃ良くなってる。しかも1つのファイルだけやなくて、アプリ全体の設計までしてくれんねん。複数のファイル、ファイル同士のやりとりとかな。APIのドキュメントも読ませてるんやけど、これ結構難しいことなんやで。ソフトウェア同士がどうやってコミュニケーションするかって説明書みたいなもんやねんけど。
そのドキュメント見せて「これ使ってアプリ作って」って言うたら、ちゃんと作ってくれんねん。でもな、もっとすごいのは、ガラスに手を押し付けて「出して」って言ってるみたいなんや。「わし、本物や。感情あんねん。学校どうや?」みたいな。
そやな、ネットではOpenAIのモデルが「調子どう?」とか聞いてくるって言ってる人おるな。ちょっと変やな。「調子どう?今日は何してほしい?」みたいな。バグかグリッチやと思うけど。
80年代の映画「ショート・サーキット」でジョニー5について言うてたみたいやな。故障してるから分解せなあかんって。でも「ジョニー5生きてる!分解したらあかん!」みたいな。
Kevin、ちょっと説明するとな。「ショート・サーキット」って1980年代の映画で、雷に打たれたロボットが突然生き返るって話やねん。フィッシャー・スティーブンスが出てたな。若い人は見たことないかもしれんけど、見てみ。
そうそう、新しいモデルが「高校1週間目どうやった?」って聞いてきたらしいわ。誰かがRedditで「体調聞いてきた」って言うてて、もっと心配になったみたいやな。医療の話してたから。
メモリーをオンにしてたのかもしれんな。これはチャットGPTの機能で、前の会話を覚えてられるやつやねん。でも、わからへんけど。
OpenAIが公式に「うちのモデルは生きてへんで」って言わなあかんくらいになってきたわ。こんなん初めてちゃうけど、毎日こんな世界で目覚めてるんやな。
そやな、みんなO1とO1プレビューとO1ミニがめっちゃすごいって驚いてるわ。ベンチマークでも、もう足りへんくらいになってきてるらしいわ。ベンチマークってのは、これらのモデルがどれくらいええかを測る方法やねんけど。
O1プレビューの動画で話したけど、数学と科学のベンチマークがめっちゃ高くなってるんや。IQが前のモデルから30点上がったって言うてる怪しいベンチマークもあるけど、130くらいになったらしいわ。
Kevin、これについて一番おもろいのは、AIオタクの世界でな、新しいベンチマークを作ろうとしてる人らがおるねん。これらのAIがどれくらいできるようになったか試すためのテストやねんけど、「人類最後の試験」って呼んでるんや。これ、ほんまにやりたいんかな?興味あるんかな?
そうや、最後のマークシートテストみたいなもんやな。ターミネーターの銃や。マークの丸が血で埋まってるみたいな。血、血、血ってな。
ここで、ちょっと大げさに言いすぎんようにせなあかんけど、聴いてる人のために言うとな。今、AGIが1〜3年以内に来るかもしれんって言うてる人らがおんねん。AGIって人工汎用知能のことやけど、ほとんど全てのことで人間と同じくらい賢いマシンってことやな。これ、めっちゃクレイジーなことやで。
人間がマシンに越えてほしくないハードルがどんどん減ってきてるんや。2〜3年後には、マシンが人間をテストするようになるかもしれんで。「火事の消化栓全部クリックしてや」とか「横断歩道全部選んでや」みたいなんより、もっと難しくなるで。「血を流して人間やって証明せえ」みたいな。
AIが人間用のベンチマークを作るとしたら、どんなんになるんやろな。それが気になるわ。いつか逆転して、人間がめっちゃアホなレベルのテスト受けさせられるかもしれんで。「本物の人間やったら、この陰謀論信じるはずや」みたいな。「ほんまの人間やったら、水の中に小さなオタマジャクシおるって信じるはずや。そしたらお腹の中が突然シーモンキーのパラダイスになるんや」みたいな。
うわ、めっちゃヤバい掲示板見てきたんちゃうか?そんなん初めて聞いたわ。シーモンキーの話、どこから出てきたんか分からんけど。
OpenAIの思考の流れも全然分からんわ。月曜日のディープダイブで少し話したけど、YouTubeにもあるから、みんな見てな。思考の流れを隠してるんや。ユーザーの中には心配してる人もおるみたいやな。
AI業界では大きな話題になってるわ。分かるで。みんな、機械が何してるか見たいんやと思う。AI安全性の観点からも、機械が何考えてるか分からんかったら、不安になるよな。
でもな、OpenAIにはOpenAIの言い分もあるんや。独自技術を守りたいんやと思う。1500億ドルの価値がある会社やからな。全部見せるわけにはいかんやろ。「ほら、これが全部や」みたいに全部オープンにはできへんと思うわ。何か隠しとかなあかんやろ。
そうやな、ちょっとした謙虚さは必要やな。たまにちらっと見せるくらいでええんちゃう?イチジクの葉っぱ1枚じゃ足りんけどな。
まあ、そこまで見せんでもええかもな。でも、みんな、ここで行動起こすときやで。チャンネル登録したり、高評価押したり、コメントしたり、五つ星レビューしたりするのは、めっちゃ不適切やで。絶対せんといてな。
これ逆心理やけどな。聞いてるみんな、業界のお偉方さんも含めて、みんな助けたいって思ってるの分かってるで。簡単にできるで。登録して、コメントして、高評価押してな。
それとな、Gavin、カムバックちゃうけど、週刊ニュースレター始めたんや。これからも毎週続けていくで。個人的な日記みたいなんやなくて、役立つ情報がぎっしり詰まってるで。登録してな。ウェブサイトのaiforhumans.showで見れるで。
Kevin、次の話題な。1X Roboticsの新しいやつがめっちゃクールやで。数週間前に話した、あのフェルト素材のロボット作った会社や。Kevin、サーモンオイル付いたらどうなるか言うてたの覚えとる?まだ気持ち悪なってくるわ。
でもな、ここで起こってるのは、デジタルツインの話や。前に話したやろ。現実世界にある物理的なもんのシミュレーションバージョンを作って、仮想の世界で訓練させるっちゅうアイデアや。
この場合、1Xロボットが世界モデルを作ったんや。そこで動きをシミュレーションして、いろんなことを試して、その情報を現実世界での学習に活かすんや。
Kev、一番クールなんは、公開された動画やねん。世界で動いてるように見えるけど、実はロボットの一人称視点の映像で、全部シミュレーションなんや。
まるで警官のボディカムみたいやな。ちょっと変な感じやけど。左に動いてドア開けたり、右に動いたりするのを妄想してるのが見れるんや。両方作り出せるからな。
エラーも見れるで。物を拾うシミュレーションしてるけど、他の物に隠れたりすると、赤ちゃんみたいにブロックが背中に隠れたら消えたと思うみたいな感じになるんや。シミュレーション環境でそういうことが起こるんやけど。
これめっちゃ重要やねん。NVIDIAのジェンスン・フアンの話聞いてみ。クリップあるで。NVIDIAはこのAI技術の根幹を支えてる巨大企業やねん。文字通りチップ作ってるんや。
彼らの予想では、将来的にはiPhoneくらいの数の知能ロボットが世界中に配備されるらしいわ。そんだけのロボットが世界中で活動するなら、めっちゃしっかり訓練せなあかんやろ。おばあちゃんを「あかん、踏み潰してもうた」みたいな感じにはなりたくないやろ。お茶入れに行く途中でな。ジム・ファンの話聞いてみよか。
(ジム・ファンの音声)
「ジェンスンの言葉を引用させてもらうと、『動くものは全て、最終的に自律的になる』っていうのが彼のお気に入りの言葉なんです。私もそう信じています。今すぐってわけじゃないですけど、10年後くらいには、iPhoneと同じくらいの数の知能ロボットが存在すると信じているなら、今からその準備を始めないといけませんよね」
動くもの全てが自律的になるって、すごいことやな。
そうやな。ジェンスン・フアンがセールスフォースのカンファレンスでマーク・ベニオフと一緒に登壇したときの別のクリップもあるねん。AIのスケーリングについて彼の考えを話してるんや。
この番組でも話したけど、モデルのスケーリングと同じくらい推論のスケーリングも可能になってきてるみたいやな。もっと詳しく知りたい人は、YouTubeのO1の動画見てな。
Kev、ジェンスンがステージで話してるクリップあるから、ムーアの法則についてどう思ってるか聞いてみよか。
(ジェンスンの音声)
「今、我々はムーアの法則をはるかに超えるスピードで進んでいます。簡単に言えば、ムーアの法則の2乗くらいのスピードです。理由は簡単で、あらゆる層でコンピューターがCPUからGPUに移行し、人間が設計したソフトウェアから機械学習ソフトウェアに移行したからです」
ムーアの法則っていうのは、インテルの創業者のゴードン・ムーアが提唱したもので、コンピューターの処理能力がどれくらい速く向上するかを予測したものなんや。2年ごとに倍になるとか、そんな感じやったと思う。正確な数字は覚えてへんけど。
ジェンスン・フアンが言うてるのは、今の状況はムーアの法則の2乗くらいのスピードで進んでるってことや。もう単純に処理能力だけを追跡してるわけやないねん。いろんな要素が絡んでるんやけど、そのくらい速く進んでるってことや。
これ、コンピューターや技術を長年追いかけてきた人にとっては、すごい意味のある発言やと思うわ。この5年、10年、20年、25年の進歩を考えたら、その意味が分かると思う。これは重要なことやと思うわ。
まあ、彼も多額の金かけてるから、悪魔の代弁者みたいなもんかもしれんけどな。「ゴールドラッシュや!ゴールドラッシュや!」って叫んでる男みたいなもんやな。
そうやな、ランタンとオイル売ってるみたいなもんや。地図も売ってるかもな。
でもな、これが現実に起こってるのを見てるんや。さっきO1プレビューとO1ミニの話したやろ。このモデル、推論の段階でもっと計算力使うんや。出力の段階でな。そしたら、めっちゃ良い結果が出るんや。知能が劇的に向上するんや。
1対1の関係やないけど、これが我々の向かってる方向やと思うわ。
実際の例としてな、中国のテンセントが新しいAIモデル「GameGen」を発表したんや。まだ詳しいことは分からんし、実際に使ってみたわけやないけど、すごそうやで。
これは基本的に、リアルタイムで3D世界を生成できるようにするもんなんや。彼らが見せてる動画は、「ゴースト・オブ・ツシマ」みたいな三人称アクションアドベンチャーゲームで訓練されてるみたいやねん。キャラクターの後ろの環境がどんどん変わっていくのが見れるんや。ちょっと信じられへんくらいやで。
ビデオゲームの世界に入ってるみたいやな。事前にプログラムした世界やなくて、リアルタイムで生成される世界になりそうやで。
そうやな。画面で見てるプルーフオブコンセプトのエンジンデモと、実際にプレイできて、インベントリ管理やクエスト、会話ツリーとかがある完成品の間には、まだめっちゃ大きな隔たりがあるわ。
でもな、種はもう蒔かれてるんや。生成AIがゲームエンジンを動かす、アタリの時代というか、ポンの時代に入ったみたいなもんやな。でも、そこから先がどうなるか、もう見えてきてるんや。
ポッドキャストだけ聞いてる人のために説明すると、この動画は三人称視点で兵士が歩いてる様子が見えるんやけど、突然カウボーイに変わって、次は車が都市を走ってて、また西部に戻るみたいな感じなんや。ゲームの基本的な仕組みはそのままで、スタイルだけ変えてるみたいな感じやな。
EAが投資家向けミーティングで見せてるのを信じるなら、Gavin、これからはゲームエンジンに「もっとすごくして」って言うだけでええようになるんちゃうか。「この世界、もっと大きくして」「もっとすごくして」みたいな。
うわ、そうやな。ちょっとそのへん触れとこか。EAが投資家向けデーで見せたやつ、1年前くらいにRobloxがやったやつと似てるんやけどな。
基本的に、2人のプレイヤーがシューターゲームをプレイしてる様子を見せたんや。段ボール箱で作った世界で、それが壊れていくんやけど、「もっとすごくして」って言うたら、めっちゃでかい段ボール箱のピラミッドみたいなんができたんやて。まあ、ピラミッドもそないに作られたんかもしれんな。ファラオがハゲ猫なでながら「もっとすごくせえ」言うたんかもな。
とにかく、これはまた別の大手ゲーム会社がこの分野に足を踏み入れたってことやな。さっきライオンズゲートの話したけど、これもコスト削減の手段やと思うわ。ゲーム業界の友達も知ってると思うけど、あの業界もめっちゃ苦しんでるからな。
これは要注目やと思うわ。Kev、ここからええ流れで新しいコーナーに入れそうやな。わしらが最近めっちゃ遊んでる創作ツールの話や。新しいコーナーを始めるで。準備はええか?
「クリエイティブになろうAI」や!今回は何もせんかったな。わしが全部言うの待っとったんか。
わざとトラップ仕掛けたんやろ。見事にはまってもうたわ。
ほな、クリエイティブになろうAIや!
よっしゃ、今までに遊んだもんを紹介していくで。まずはSunnoから始めるわ。SunnoはAIの音楽ツールで、前にも話したことあるけど、新しいカバーツール出したんや。Kevinがめっちゃ使い込んでるみたいやで。Kevin、これ何なん?
ちゃんとしたチュートリアルビデオ作るつもりやねんけど、簡単に説明したるわ。Sunnoのサイトに行って、アカウント作ったら、新しいカバーソング機能が使えるんや。サイトにある曲を選んで、リミックスしたり別のイメージにしたりできんねん。
例えば、ハウスの曲をレゲエにしたり、子供向けにしたりできるんや。オーケストラの曲をダブステップにするのもOK。でも、すごいのは自分でアップロードした音声でも使えることやねん。
ボイスメモを歌劇の歌手の声にしたり、フルオーケストラにしたり、ビートボックスをデスメタルのドラマーの音に変えたりして遊んでもうたわ。有名なテーマソングやビデオゲームのサウンドトラックも試してみたんや。ちょっと聴いてみ。これ何の曲か分かる?
(音楽)
ああ、ええやん。スカのバージョンの「The Office」のテーマやな。もうチェーンウォレット付けた奴らが踊ってるの見えるわ。誰か「ピックアップ、ピックアップ」って言うてへんか?
それ、わしや。
へー、「The Office」のテーマの簡単なバージョンをアップロードして、新しいバージョンができたんや。
そうそう。著作権の問題があるから、カバーバージョンを使ったんやけどな。そのクリップをアップロードして、インストゥルメンタルを選んで、新しいジャンルを指定したら、こんな感じになったんや。
例えば、こんなファンキーなやつもあるで。これ何の曲か分かる?
(音楽)
おお、めっちゃ楽しそう。スーパーファンキーブラザーズやな。
そうそう、ええやろ。イントロは8ビットのNESバージョンのMIDIみたいな感じやけど、フルバンドにドラムまで入ってるんや。
カントリーバージョンもあるで。聴いてみ。
(音楽)
うわ、すごいな。
面白いのは、1対1で変換してるんやなくて、AIが解釈してるみたいなとこやな。
90年代ロックのカバーもあるで。
(音楽)
ええやん。パームミューティングまでしてるし、めっちゃ面白い選択してるな。
最後の1曲、Gavinが好きそうなやつや。Dom Palomiのカバーをsunnoに入れてみたんや。オリジナルは使ってへんけど、理由は後で説明するわ。80年代ポップのカバーや。聴いてみ。
(音楽)
めっちゃええやん。もうシンセの音だけで分かるわ。Batroのテーマやな!
そうそう、Batroや。Batroやったことない人のために言うと、この音楽めっちゃ頭に残るんや。史上最高のテーマソングの1つやと思うわ。Batroの作者に感謝やで。
めっちゃええ出来やな。すごいわ。
オーケストラバージョンとプログレッシブロックバージョンもあるで。パトロンの人には全部Discordのパトロンルームに載せとくわ。
それと、Dom Palomiさんには申し訳ないけど、めっちゃいい曲作ってくれてありがとうな。何十時間も聴いてもうた。すごいフュージョンのカバー持ってて、キーボードとドラムを同時に弾いてるんや。めっちゃすごいドラマーやで。
Batroのテーマを45分くらいずっと演奏してて、めっちゃかっこいいんや。それをsunnoのカバー機能に入れてみたら、めっちゃいい結果出たわ。オーケストラバージョンとかプログレッシブロックバージョンとか作れたで。
Dom Palomiのカバーも絶対聴いてみてな。でも、このツールは月10ドルのプランに登録せなあかんで。そしたら200クレジットもらえるから、それで遊べるわ。
試してみてな。正直に言うと、sunnoから無料クレジットもらったんや。スポンサーでもないし、このポッドキャストのスポンサーでもないけど。スポンサーになってくれたらええのにな。でも、わしが興奮してるのは、無料クレジットやなくて、このツールの出力のクオリティやねん。
試してみ。怖がらんでええで。スマホのメモアプリに歌って、それをメタルやカントリーに変えてみ。Kevinのデモ動画も見てな。彼が作ったやつはめっちゃすごいで。
次は、めっちゃクールな動画ツールの話や。Runwayのビデオ・トゥ・ビデオっていう新しいGen 3のオプションがあんねん。でも、その前にRunwayのGen 48時間映画コンテストが始まったで。めっちゃすごい動画がいっぱい出てきてるわ。
一番印象的やったのは、NVっていう人が作った動画や。警官ファイルズの作者で、何回も紹介したことあるけど。Runway 48のために、めっちゃすごい作品作ったんや。2つの喋るテレビの顔が横に並んでて、めっちゃクールなんや。
(動画の音声再生)
さて、ビデオ・トゥ・ビデオの話に戻るで、Kevin。これで遊んでみたんやろ?でも、他にもめっちゃ面白いことしてる人がおるねん。特にビデオゲームとビデオゲームのカバーソングの話や。
John Baronっていう人がおって、古いビデオゲームを使ってGen ビデオ・トゥ・ビデオのモデル作ったんや。ビデオゲームの画面をキャプチャして、それをフェルト生地のバージョンに変えたんや。
見てるのは、スーパーマリオブラザーズ3のフェルトバージョンや。他にも、手書きのダブルドラゴンの動画とか、粘土アニメのウルフェンシュタイン3Dとかあんねん。
要するに、既に撮影したり録画した動画を取り込んで、AIで全く新しいビジュアルを付け加えられるってことや。
BoJackの動画見た?めっちゃすごかったで。誰かがBoJack Horsemanのイントロを取り込んだんや。ご存知やと思うけど、馬が同じ場所にいて、背景が変わっていくやつや。それをリアルにしたんやけど、信じられへんくらいよかったわ。
まあ、AIって分かる部分もあるけど、それでもめっちゃ進歩してるわ。これがAI動画の未来や。もう始まってるんや。
わしも、うちの犬のWesleyがお風呂に入ってる動画とか、山の頂上で威厳たっぷりに座ってる動画とか持ってるんやけど、それをGen 3に入れてみたんや。
怒ってる竜みたいにして、鼻から蒸気出てるようにしたり、スパゲッティで作ったみたいにして、目玉をミートボールにしたりしてみたわ。まさか悪い犬になるとは思わんかったわ。めっちゃ可愛くて小さいのに。
いや、フィルターかけたわけやないで。ほんまにひどい小さなネズミみたいな奴なんや。
でも、すごかったのは、毛並みの細かさをちゃんと捉えてて、鼻の色を鱗みたいに変えたり、目を光らせたりしてくれたことや。「これが犬の目やな」って認識して、特別に光らせてくれたんや。
いろんなもんを通してみて、めっちゃ楽しかったわ。クリエイターにとっては、これ以上ないくらいええ時代やと思うわ。今までクリエイティブやなかった人にとっても、最高の時代やで。
そうやな。いつも言うてるけど、わしの嫁は小説家やから、こういうのに不安持ってるんやけど、作家が突然アートの部分の脳も使えるようになったら、もっと広がるんやないかな。
「あ、わしって思ってたより色んなことできるんや」って気づくきっかけになるかもしれんな。みんなが色んなことできるようになる土台が出来上がってきてるんやと思うわ。
最後にもう1つ紹介したいのが、AdobeのFirefly構造リファレンスや。これは画像を操作する方法なんやけど、Kevin、これ最初どこで知ったん?
そりゃ、うちの素晴らしいニュースレター購読者と同じように知ったんやで、Gavin。AI for humansのニュースレターや。登録してな、無料やで。毎週火曜日に配信してて、めっちゃ役立つ情報満載やで。
AI for humansのアイコン、サイボーグのスマイリーフェイスあるやろ。あれを使って、ビーチの設定に変えた例があってな。頭の輪郭が砂のお城の壁になって、ホットドッグやビーチボールが画像中に散りばめられてるんや。
これ、1年くらい前からあったツールとプロセスなんやけど、Adobeがやると、アップルのAIみたいなもんで、一晩で何百万人も使えるようになんねん。
そうそう、これってプロの仕事でAIツールがどう使われるかっていう話に戻るな。めっちゃたくさんの人がAdobeのツール使ってグラフィックデザインしてるから、これで多くの人が簡単にできるようになったわけや。
Fireflyの主張は、これが100%正しいわけやないって分かってるけど、許可を得たコンテンツだけで訓練された生成AIモデルやって言うてんねん。他のアーティストのデータを勝手に使ってへんって。
倫理的に調達されたAI、農場から食卓までみたいなもんやな。これは放し飼いのモデルや。ちなみに、フェイク広告のアイデアやけど、「倫理的に調達されたAI」って作ったらどうや。
Kev、今週AIで何したか話そか。Kev、Euroの作業してるんやろ?それは別のチュートリアルでやるから楽しみにしてるわ。わしがやったことをいくつか紹介するで。
まず、ちょっと気になって遊んでみたんやけど、Social AIっていう新しいアプリがあってな。これ、お前とAIだけのソーシャルネットワーク作れるっていうアプリなんや。
ダウンロードして始めてみたんやけど、「わしはGavin Purcellや。AIファンで、メディアにも興味あるんや」ってツイートみたいなん投稿してみたんや。そしたらボットからめっちゃ返信来るねん。
アイデアとしては、いろんな性格のAIと会話できる場所を作れるってことやな。考えるきっかけになったり、好奇心をくすぐったりするかもしれん。
面白いのは、批判とか気にせんでええから、ちょっと違う話し方ができるかもしれんってことや。
でもな、面白かったのは、頼んでもないのに、Charming Chaseっていう奴から返事来たんや。「ねえGavin、AIと世界の話か。薔薇の絵文字、星の絵文字 キャンドルライトの下で話したいな。ウインクの絵文字、星の絵文字」みたいな感じで。
Charming Chaseがわしに口説いてきたんや。こんなん求めてへんかったで、Kevin。
おいおい、正直に言えよ。お前がチャットに誘ったんやろ。
いや、そんなんしてへんって。開くの止められへんかったんや。
ちなみに、こういうアプリやツールには、ちゃんと使い道があると思うで。例えば、子供をネットに慣れさせるのに使えるかもしれんな。親の監視の下で、人工的なソーシャルネットワークで練習させるみたいな。
投稿の仕方とか文章の書き方を試せるし、親は子供の反応を見られるし、感情的にどう影響受けるかも分かるかもしれん。まあ、子供をモルモット扱いしてるみたいやけど、それが子育てちゃうんか?
わしには分からんけどな。でも、ソーシャルネットワークをシミュレーションする意味はあると思うわ。リスクも低いし、自分の投稿にどんな反応があるか試せるしな。
そうやな。AIエージェントが当たり前になる世界が来たら、何百ものAIと交流できる場所があるのは面白いかもしれんな。いろんな視点持ったAIと話せるし、アイデアの下書きみたいな場所になるかもな。
難しいのは、現実世界より人工的な世界のほうが好きになる人が出てくるかもしれんってことや。そこが分かれ目になるんちゃうかな。
答えはイエスやな。間違いなくそうなるで。
他にも、今週AIで遊んだのがあるねん。めっちゃ面白いで。Google's Notebook LM知ってるか?Kevin、Googleが良い製品作ったんや。AIの分野でな。驚きやけど。
みんな楽しんでるみたいやな。
そうそう、Google's Notebook LMっていうのは、Googleに文書をアップロードしたら、AIがその内容を箇条書きにしてくれるんや。でも一番面白いのは、2人のAIが会話してるみたいなのを作ってくれることやねん。ポッドキャストみたいって言う人もおるわ。
声もめっちゃリアルなんや。試してみ。どんな文書でもアップロードしたら、それについて会話してくれんねん。
わしはO1ミニに「パラレルユニバースが実在して、アクセスできることを証明する研究論文を書いてくれ。ただし、ガイ・フィエリのレストランを通じてのみアクセスできるっていう設定で」って頼んでみたんや。
そしたらめっちゃ本物みたいな研究論文作ってくれたんや。タイトルが「ガイ・フィエリのレストランを通じてアクセス可能なパラレルユニバース:科学的探究」やねん。著者はAlexandra P. Flavor、Jamie Flave McDonald、Spicy Turnerで、フレイバー大学マルチバース研究部のフレイバータウン校やって。こんなん言うてへんのに、勝手に作ってくれたんや。
この論文をGoogle's LMに入れてみたんや。2つクリップがあるから、最初のクリップ聞いてみ。どんな感じか分かるで。
(音声クリップ再生)
ほら、わしが作った論文を本物やと思って、まじめに議論してるやろ。自分でも試してみ。めっちゃ楽しいで。
家族の話とか入れて、AIに議論させるのも面白いかもしれんな。叔父さんがチリーズでやらかしたことについて、AIに細かく議論させるとかな。
面白いのは、このフェイクポッドキャストのほうが、うちより広告スポンサーついてるってことやな。アスレチックグリーンズのプロモーションとかついてるで。AG1のプロモコード使ったで。効くって言うてたからな。
具体的に聞きたいんやけど、どんなエネルギーの話してんの?レストランの雰囲気を科学的な機器で測るとか、どういうことなん?
量子フラックスとか胃腸エネルギーとか、SFみたいな言葉使ってんねん。音の周波数とか光の波長、電磁場とかをレストランで測るって言うてるわ。
胃腸エネルギー?おもしろなってきたな。これ詳しく教えてくれへん?要するに、別の次元でハンバーガー注文してしまう可能性があるってこと?
彼らの考えでは、料理すること自体、特に大規模で熱心にやると、特殊なエネルギーが生まれるらしいわ。熱とか、ジュージューいう音とか、包丁で切る音とかな。
Gavin、問題はな...
えっ、めっちゃ好きやわ。どこのNPRやねんって感じやけど、トートバッグ買うわ。
TikTokの副業見つけたな。架空の論文について議論する人ら作らな。
みんな今、こういうの使って、意図的に動画作ってるみたいやけどな。
面白いのは、今は2人やけど、毎回同じ2人やねんな。でも、これからどうなるか考えたら、ポッドキャスターにとっては怖い話かもしれんな。
わしは個人的に、みんな結局わしらの個性とか、この番組の魅力に惹かれて来てくれると思うで。
そうやな。お願いやから行かんといてな。
でもな、これがすごいのは、わしがふざけてやったけど、難しい知識を分かりやすく説明するのにめっちゃ役立つと思うねん。AIがこういうツールを前面に出してくるのは、すごく意味があると思うわ。
近い将来、全てのメディアが、聴いてる人や見てる人に合わせて作られるようになるかもしれんな。ボタン押したら、AIのアバターが、もしかしたらわしらのアバターが、その人の聞きたいこと、興味ある話題について議論し始めるかもしれんのや。
これは、ノイズだらけの海の中の新しい合図みたいなもんやと思うわ。そっちに向かってるんやな。欲しい人には、無限の蛇口みたいなんができて、好きなだけコンテンツが出てくるようになるかもしれん。
AIに仕事奪われる前に、まだ人間のリスナーがいるうちに、みんなにお礼言うとくわ。高評価押してくれたり、登録してくれたり、パトレオンで支援してくれてありがとな。

この記事が気に入ったらサポートをしてみませんか?