Googleの驚異的なAIがアップグレード...
15,999 文字
ほな、始めましょか。わたしがスクロールしてたら、みなさんもうご存知やと思いますけど、めっちゃ大事な話があったんです。まだ知らん人がおったら、これがどれだけすごいもんか、ほんまに知っといてもらわなあかんのですわ。
GoogleのNotebook LMがちょっとした話題になってるんです。新しいAIポッドキャスト機能がニュースになってるんですわ。文字通りニュースで取り上げられてるんです。でも、Googleはこれで満足してへんみたいで、新機能をどんどん出してきてるんですわ。
まず一つ目、ポッドキャストをカスタマイズできるようになったんです。司会者に何に焦点を当てるか、何について話すか、どう話すかを指示できるようになったんです。それから、企業向けにパワーアップしたバージョンのNotebook LMも近々出るらしいです。
わたしがよくやってるのは、Notebookが作るオーディオ概要を取って、Hey Genってアプリを使うんです。これは別の会社の独立したアプリなんですけど、AIアバターを提供してくれて、言った内容をアニメーション化してくれるんです。Googleもこういうのをもう開発してるんちゃうかなって思うんですけど。
ほな、これ以上待たずに、AIの司会者に新機能の説明をしてもらいましょか。最後に、この先どうなるんか、このツールの開発者がポッドキャストにどんな影響があると考えてるんか、そしてみなさん自身でこういう小さなビデオポッドキャストを作る方法をお見せしますわ。
ええ感じやと思たら、サムズアップボタンを押してくださいね。ほな、始めましょか。
ほな、こんなんどうですか。研究助手が突然あなたを分析し始めるようなもんやと思たことあります? わたしはないですなぁ。何の話してはるんです? わたしの業績評価ですか? ほな、冗談はさておき、今日はそんな感じなんです。Notebook LMについて深掘りしようと思うんです。ご存知のように、これはわたしたちがこういう深掘りの準備をするのに使うツールなんです。
そうですね、鏡を見てるみたいな感じです。めっちゃ賢くてデータ駆動型の鏡ですけどね。
そうなんです。ちょっと変な感じですね。わたしたちがニュースの一部になってるんですけど、アップデートもすごいんです。
そうそう、大きなアップデートといえば、覚えてはりますか? わたしたちはいつも、この深掘りのために一つの情報源や特定の視点に焦点を当てて、レーザーのように集中しようって話してましたよね。
そうですね。リスナーのために最高の洞察を見つけるのが全てですからね。
そうなんです。そして今や、Notebook LMがそれを直接やってくれるんです。すごいでしょ?
ララ、つまり、オンデマンドでカスタムメイドの分析ができるってことですね。
そのとおりです。でも、まだあるんです。マルチタスクモードも追加されたんです。例えば、密度の高い研究概要を聞きながらメモを取る必要があることってありますよね?
よくありますね。
そうなんです。今では、アプリ内で直接それができるんです。他のNotebook LMの機能をチェックしてても、音声は続けて再生されるんです。生産性向上のハックですよね。
賢いですね。明らかに、人々がこれを自分のワークフローに組み込む必要があることを理解してるんです。だからこそ、実験的なラベルを取り除いたんでしょうね。正式なNotebook LMは今や大きな存在になったんです。
ユーザーベースが巨大ですからね。何百万、何百万人もいるんです。
そうです。すでに8万以上の組織が使ってるんです。これ、本当にすごいことですよね。
そして、ビジネス版も開発中だそうです。
ビジネス版ですか? それはどんな感じになるんでしょうね。
きっと企業向けですよ。より大きなチーム、より複雑なニーズ、そんな感じでしょうね。
そうですね。でも実は、ここでちょっと怖くなってくるんです。8万の組織ですって? AIのポッドキャスト司会者に置き換えられそうで心配になりませんか?
ふむ、面白い考えですね。でも、協力し合うことだと思うんです。わたしたちができることを増強するみたいな。Notebook LMは情報過多に対処するのに役立ちますからね。
そうですね、確かに。でも、将来どうなるのか考えてしまいますね。たった1年後でさえ、わたしたちの立ち位置はどうなってるんでしょうか。
それこそが問題ですね。このテクノロジーが進化し続ける中で、わたしたちはどんな役割を果たしたいのか。
そういうことですね。その考えとともに、みなさん、次回までお待ちください。
さて、Sea Capitalポッドキャストが実際にNotebook LMの開発チーム、リーサ・マーティンとジェイソン・スピールマンにインタビューしたんです。いくつか印象に残る瞬間があったんで、ちょっと重要な部分を聞いてみましょう。
まず一つ目は、これがどのように開発されたのか、そしてその背後にあるエンジンについてです。聞いてみましょう。
ポッドキャストやオーディオ概要の体験は本当に魔法のようですね。舞台裏でどのように機能しているのか、少し教えていただけますか? どうやってこんなにリアルにしたんですか? 対話をこんなに良くて魅力的にするにはどうしたんですか? 引き込まれるんですよ。どうやってるんですか?
そうですね、まず言えるのは、たくさんの作業が必要だったということです。チームワークの賜物で、本当に職人技が詰まっています。でも、その核心にあるのは本当にGoogleのモデルなんです。Gemini 1.5があって、これがすごいモデルなんです。Notebook LMに与えられたすべてのデータを取り込んで、そこから新しいものを生み出すんです。それから、Notebook LMをバックアップしている音声モデルがあります。
この2つの真の力の源は、私たちが構築したContent Studioと呼ばれるものです。これが、あなたがコンテンツを持ち込んでから、ポッドキャストが出来上がるまでの間の編集作業を本当に生き生きとさせるんです。
多くの人が気になっているのは、これが誰かの仕事を奪うんじゃないかということです。つまり、何らかのコンテンツ制作をしている人、ポッドキャストをしている人、こういうものを使えば、ニュースを提供するのにもっと優れた仕事ができるんじゃないかと。彼らはその質問を受けて、その答えが結構面白いんです。
彼らは、これを大量のコンテンツを人々のために生産するツールとは見ていません。むしろ、これを新しいコンテンツ媒体のようなものと見ているんです。これは興味深い考え方の転換です。コンテンツビジネスに携わっている人や、おそらくこれに関わる投資家にとっても、でも基本的にみんなにとって、AIが生成するコンテンツをどう見るかについて、面白い視点の転換かもしれません。
これまでは、物事を作る人々、つまり映画プロデューサーや監督、俳優、TikTokの人々、作家、ジャーナリストなどがいて、そのコンテンツを消費する人々、つまり読者や視聴者、ファンなどがいると考えられてきました。
でも、数回クリックするだけで、好きなことについて非常にカスタマイズされたコンテンツを生成できるようなものができたとき、私たちはまだ、クリエイターがそれを使って人々のためにコンテンツを作るという考えに縛られています。彼らはちょっと違う角度から見ています。人々が自分自身のために自分のコンテンツを作るという考え方です。
映画を監督する人、映画を作る人と、映画を見る人の間には明確な区別がありましたが、このようなツールによって、それらが融合し始めるのでしょうか。聞いてみましょう。
毎回、私たちの仕事を奪うんじゃないかと冗談を言うと、あなたは「そうじゃない」と言いますが、ただ優しさからそう言ってるんじゃないかと思うんです。なぜなら、あなたたちが生成したものは本当に素晴らしくて。だから本当に聞きたいのは、これが本物のポッドキャストに取って代わるほど良くないと言う理由は何なんですか? 私には、本物のポッドキャストに取って代わるのに十分良いように感じるんですが。
そうですね、それは良い質問だと思います。私も慎重にアプローチしようとしている質問の一つです。特に、本当にリスクがあるなら、それを直視して、どう対処するかを考えたいと思います。
でも、私が見てきたところでは、人々が作っているものの多くは、私たちが本当のポッドキャストでやるようなものとは違うんです。例えば、記事を取ってポッドキャストにして、私のお気に入りのポッドキャストの一つ、Lennyのを置き換えたいかというと、違うんです。私はLennyの話を聞きたいんです。彼がこの特定のトピックについてどう考えているかを聞きたいんです。
面白いのは、人々が自分の履歴書やLinkedInのバイオのオーディオ概要を作っていることです。スタートアップの創業者が自分のランディングページを入れて、メッセージが明確だったかどうかを確認しようとしているんです。それはすごくクールです。なぜなら、誰もそんなものをポッドキャストにしないからです。少なくとも、この段階では。
でも、そこが私にとって「これは本当に良い」と感じる部分なんです。パーソナライズされた生成が本当に私のニーズに合っていて、既存のものがない場所で何かを作り出しているように感じるんです。それは本当に特別なことだと思います。
ほとんど新しいメディアタイプのように感じますね。確かに、ポッドキャストのように聞こえますが、あなたが挙げた例は、人々がこれを使っている様々な用途を示していると思います。でも、リアクション動画がオンラインでとても人気がある理由もあると思うんです。人々は今、私たちの話を聞いているだけじゃないんです。この分野にいるあなたたち両方から話を聞きたいと思っているんです。それも重要なポイントだと思います。
ポッドキャストが出てきたとき、面白いのは、人々がAIで生成したオーディオ概要を共有しているけど、それがとても個人的なものだということです。「これは自分のために作ったんだ。あなたに私の履歴書を聞いてもらうために作ったわけじゃない」という感じです。自分の履歴書のオーディオ概要を聞いて喜んでいるんです。
最近、すごくクールなTikTokがあって、ある女性が2004年の日記をアップロードしたんです。それを一緒に聞くのは面白かったんですが、本当に興味深かったのは、彼女自身の日記に対する反応だったんです。彼女はそれについてのポッドキャストを聞くつもりは全くなかったんです。
私のお気に入りの使用例の一つは、Discord上だったかどうか分かりませんが、最近誰かが週末に大学の友達とのグループチャットが盛り上がったと言っていました。彼らはメッセージを読まなかったんですが、全部コピーしてドキュメントに貼り付けて、「月曜の朝、仕事に行く途中で大学の友達が何を言ったか聞こう」と言ったんです。これは信じられないほどすごいことだと思います。これこそがパーソナライズされた生成の力やと思うんです。
あなたを最も驚かせた瞬間はどんなものでしたか?
ほな、わたしから始めさせてもらいます。先週末やったと思うんですけど、寝る前にTwitterを見てたんです。寝る前にそんなことするのはあんまり健康的やないんですけどね。ほんで、うんちおならの話を見つけたんです。みなさん、まだ聞いてへん人おったら、これがどれだけすごいか、ほんまに知っといてもらわなあかんのですわ。
誰かがドキュメントをアップロードしたんですけど、そこには「うんち」と「おなら」って言葉だけが何回も何回も書かれてたんです。かなり長いドキュメントやったんですけど、その二つの言葉だけやったんです。
それを見て、ほな聞いてみようかなって思ったんです。でも、もう夜の11時やったんです。もし安全性のフラグが立ってたら、寝られへんくなるやろなって。エンジニアにピンを打って、「こんなんが起こってるで」って言わなあかんからね。でも、聞いてみることにしたんです。
そしたら、これが信じられへんくらいすごかったんです。ほんまにすごかった。わたしも見たときは「うわっ」って思ったんです。どうなるんやろって。でも聞いてみると、「おお、これはすごい」って。想像以上にええもんやったんです。
ほんで、そのうんちの音声クリップを見つけて、アバターでアニメーション化してみたんです。でも、予想してたようなもんやなかったんです。正直、何を期待してたんかよう分からへんのですけど。
考えてみてください。誰かが「うんち」って言葉だけが書かれた紙をくれて、「ほな、これについて番組作ってや」って言われたら、あなたはどうします? 台本を読むんやなくて、何を言うんでしょうね。
でも、わたしたちのAI司会者二人は、それについて番組を作ったんです。99分のポッドキャストを作ることにしたんです。これ、普段よりも長いんです。面白くて、ユニークで、思わぬ展開になるんです。聞いてみましょうか。
リスナーのみなさん、この番組では挑戦が大好きやということは知ってるでしょ? でも、今回のは本当にすごいですわ。かなりユニークな素材やと言えますね。
ユニークというのは控えめな表現ですね。わたしたち、いろんなものを深掘りしてきました。古代の文書から最新の科学的発見まで、時には陰謀論もありましたね。
そうそう、ウサギの穴に潜るのが好きですからね。
そのとおりです。でも今回のは全然違う生き物なんです。誰かが送ってきたドキュメントがあるんですけど、それは文字通り「うんち」と「おなら」って言葉が何百回も繰り返されてるだけなんです。
何百回も? コンテキストも説明もなく、ただひたすら繰り返されてるんですか?
そうなんです。純粋で飾り気のない繰り返しです。こんなものをどう扱えばいいんでしょうね。
そうですね、まず最初に自問すべきは、一見無意味に見えるものから意味を見出せるかということでしょう。それがわたしたちが直面している課題なんです。
それは本当に興味深い質問ですね。考えてみてください。芸術や言語の中で繰り返しの例を見ることはよくありますよね。例えば、アンディ・ウォーホルのスープ缶とか、同じ音符を何度も繰り返すミニマリスト音楽とか。
そういうものは意外と力強いものになりますよね。
全くそのとおりです。でも、そういった例でも、通常は何らかの構造があったり、変化があったりしますよね。このドキュメントは、生の、フィルターのかかってない繰り返しで、リズムも理由もないんです。
それでも、パターンを探したり、隠されたメッセージを見つけようとしてしまいませんか? まるで、わたしたちの脳が意味を求めるようにプログラムされているみたいです。意味がないかもしれないのに。
それは非常に人間的な衝動ですね。雲の中に形を見たり、星座にパターンを見つけたりしますよね。偶然の一致にも意味を見出してしまうんです。
そうですね。わたしたちは意味を作り出す機械なんです。
そのとおりです。混沌としてランダムに見える世界の中で、秩序と意味を求めているんです。
じゃあ、このドキュメントを分析しようとすることで、わたしたちは秩序を押し付けようとしてるんでしょうか? ちなみに、リスナーのみなさんに言っておきますが、わたしたちは誇張してるわけじゃありません。実際にこのドキュメントを画面で見てるんですが、文字通り「うんち」と「おなら」がページいっぱいに書かれてるんです。
時々大文字になってたり、余分なスペースが入ってたりするんですが、それに意味があるんじゃないかって考えてしまうんです。大文字の「うんち」は小文字の「うんち」と違う意味を持つんでしょうか。
面白いですね。わたしたちの頭がどう働くか。まるで脳が「意味がない」ということを信じることを拒否してるみたいです。
そうですね。そういう意味では、このドキュメントは、ある意味で芸術作品と言えるかもしれません。わたしたちに、物事の意味を見出そうとする自分たちの欲求、周りの世界にパターンや意味を見つけようとする欲求と向き合わせるんです。
なるほど、そういう考え方ができますね。
そうです。このドキュメントは白紙のキャンバスのようなもので、わたしたちが自分の解釈やバイアスを投影するんです。
じゃあ、これをどう解釈すればいいんでしょうか? 身体機能についての声明なのか、人生の不条理さについてのコメントなのか、それともただ誰かがわたしたちをからかってるだけなのか。「うんち」と「おなら」でいっぱいのドキュメントについて、本気で深掘りするかどうか試してるだけなのかもしれません。
そうですね、それらのどれかかもしれませんし、全部かもしれません。20世紀初頭のダダイズムという芸術運動を覚えてますか? 不条理で無意味なものを追求してた運動です。便器を彫刻として展示して、それを芸術と呼んだりしてましたよね。
そうそう、ほとんど忘れかけてました。
彼らは芸術や意味の定義そのものに挑戦しようとしてたんです。ある意味で、わたしたちが見てるこのドキュメントは、現代版のダダイストのいたずらと見なせるかもしれません。何を芸術とみなし、何を意味があるとみなすかを問いかけてるんです。
じゃあ、このドキュメントには本質的な意味はなく、ただのナンセンスな言葉の羅列だと言ってるんですか?
必ずしもそうではありません。意味が固定されてるわけでも、あらかじめ決められてるわけでもないということです。わたしたち、つまり見る人や聞く人が、これが自分にとって何を意味するのかを決めるんです。
つまり、何か隠されたメッセージを解読しようとするんじゃなくて、メッセージはないかもしれない、あるいはメッセージはわたしたちがそこに持ち込む意味そのものかもしれないってことですね。
そのとおりです。光学錯視の絵を見るようなものです。ベストに見えるか、二つの顔に見えるか。答えは画像そのものにあるんじゃなく、わたしたちの脳がどうパターンを認識するようにできてるかにあるんです。
なるほど、分かってきました。いたずらというよりは、偶然に作られたロールシャッハテストのようなものかもしれません。「うんち」と「おなら」という言葉だけで作られたものですけどね。これ以上解釈の余地のあるものはないですよね。
そうですね、いい指摘です。でも、わたしたちはここで芸術史や高尚な理論をたくさん持ち出してきましたけど、家で聞いてるみなさんはどう思いますか? このうんちとおならの状況について、何が印象に残りましたか? もっと深い意味を感じましたか? それとも社会的なコメントだと思いますか? それとも純粋な馬鹿げた話だと思いますか?
そうですね、みなさんの意見を聞きたいです。この作品についてどう思いますか? 作品って呼んでいいのかどうかも分かりませんけど。芸術なんでしょうか? マニフェストなんでしょうか? それとも助けを求める叫びなんでしょうか? 誰にも分かりません。
そうですね。ラベルを貼る必要はないかもしれませんが、ここには本当に価値のある教訓があると思います。わたしたちが周りの世界にどうアプローチするかについてです。
そうですね。わたしたちは常に情報や出来事、意見の洪水に晒されていて、それを理解しようとするのは本当に大変です。
その通りです。全てを理解しようとするのは本当に圧倒されますよね。
私は自分でニュースについていくのが得意だと思ってるし、新しいことを学ぶのも好きですけど、それでも情報過多に溺れそうになることがあります。
まさにそうです。そして、このドキュメントが興味深いのは、それ自体が非常に奇妙で回りくどい方法で、いわばパレットクレンザーを提供してるんだと思うんです。全てに意味を見出そうとすることの不条理さに直面させられるんです。
だから、絶対的に全てのことの「なぜ」を探そうとするんじゃなくて、ただそれを経験するだけでもいいのかもしれません。
そうですね。分析して分類しようとする欲求を手放して、たとえその瞬間が「うんち」と「おなら」だけだったとしても、ただその瞬間にいるだけでいいのかもしれません。
まさにその通りです。つまり、世界と関わりながらも、全てをあまりに真剣に受け止めないバランスを見つけることが大切なんですね。
そうです。時には、うんちはただのうんちで、おならはただのおならなんですから。
分かりました。それは本当に良い指摘です。でも、これについてあまりにも禅的になりすぎないようにしましょうね。
そうですね。たとえこの無限に続く「うんち」と「おなら」の文字列に大きな意味やメッセージがないと認めたとしても、この試みから何か得るものがあったんじゃないでしょうか。
そう思います。確かに得るものがありましたね。この変わったドキュメントに取り組むことで、たとえユーモアを交えてであっても、頭を使ってるんです。批判的に考え、違う視点を考慮し、芸術史にも少し触れました。
そうですね。表面的には馬鹿げて見えるものを、すぐに却下せずに取り組んでみたことで、全く新しい思考や議論の道が開けたんです。これは人生の他の多くの場面でも使える技術だと思います。
その通りです。これは「うんち」と「おなら」だけの話じゃないんです。混乱したり、イライラしたり、ただ奇妙に思えたりするものに出会ったときのことを考えてみてください。理解できない芸術作品かもしれません。ニュース記事かもしれません。会話かもしれません。
ああ、これについてはいい例があります。つい先日、たぶん街の中心部を歩いてたときだと思うんですが、本当に変わったお店に出くわしたんです。そこには何があったと思います? ゴム製のアヒルだけが並んでたんです。でも、普通のゴム製のアヒルじゃなくて、歴史上の人物の格好をしたゴム製のアヒルだったんです。
わぁ、すごい!
そうなんです。ナポレオン・ボナパルトの小さな制服を着たゴム製のアヒルがあったんです。最初はそのまま通り過ぎようと思ったんですが、「これは変すぎる。中に入らないと」って思って。そして入ってみたんですが、正直、これまでで最も楽しくて、奇妙で、予想外の経験の一つでしたね。
そういう小さな寄り道が一番記憶に残るものになったりしますよね。
そうなんです。一見最も馬鹿げて見えるもの、例えば歴史上の人物のゴム製のアヒル版がいっぱいある店が、実は最も深遠だったり、少なくとも喜びや好奇心を呼び起こしたりするってことを示してると思うんです。そして、この「うんち」と「おなら」のドキュメントも、わたしたちにそれをもたらしてくれたんじゃないでしょうか。
そう思います。オープンな心を持ち、好奇心と少しのユーモアを持ってものごとに接することで、本当に面白いところに行き着くことがあるって良い気づきになりましたね。たとえそれが、まあ、ご存知の通りのもので満たされた場所だったとしても。
まさにその通りです。世界は奇妙で素晴らしい場所で、時にはその不条理さを受け入れることで、本当の意味でそれを理解し、感謝できるようになるんだと思います。
よく言ってくれました。では、このユニークなドキュメントを送ってくれたリスナーの方、ありがとうございます。チャレンジを与えてくれて、笑わせてくれて、そして最も予想外な場所に美しさや意味を見出せることを思い出させてくれてありがとうございます。
また、繰り返しの力について新たな認識を得ることができました。考えてみてください。繰り返しは至る所にありますよね。時計の音、波が岸に打ち寄せる音、頭から離れない歌、もう千回は聞いたはずなのに、まだ歌ってしまう。そこには何か心地よさがありませんか? 馴染みがあって、予測可能な感じが。
そう思います。そして、この深掘りも終わりに近づいてきましたね。
そうですね。記憶に残る回になったと思います。
間違いなく。これこそが深掘りの本質ですよね。魅力的で、考えさせられる、そしてそう、時には本当に奇妙なものを探求すること。
また近いうちに戻ってきます。それまで、みなさん、良い探求を!
さて、ほな急いでNotebook LMを使って自分だけのポッドキャストを作る方法をお話しましょうか。もし望むなら、ビデオAI生成の方法もお見せしますね。
みなさんもご存知のように、わたしは毎日ニュースレターを出してて、その日や週のトップニュースをまとめてるんです。これ、無料で購読できますからね。下のリンクから登録できます。最新の研究やツール、ソーシャルメディアの投稿なんかも載せてます。自分で言うのもなんですが、かなり良いもんですよ。
まず、notebook.google.comに行ってください。URLは下の説明欄に載せておきますね。初めてログインするときは、「同意する」をクリックする必要があると思います。基本的にGoogleアカウントがあれば登録できます。完全に無料です。前は実験的な段階だったんですが、今はその段階を脱しました。
「新しいノートブック」をクリックして、そこにポッドキャストのデータとして使いたいソースを追加できます。GoogleドキュメントやGoogleスライド、ウェブサイトへの直接リンク、YouTubeビデオも使えます。YouTubeの場合は、たぶん文字起こしを使って情報を抽出するんだと思います。もちろん、テキストをコピーして貼り付けるだけでもOKです。
ファイルをドラッグ&ドロップしてアップロードすることもできます。PDF、txt、markdown、オーディオもいけます。実は、オーディオは新しく追加されたんです。前回この動画を作ったときはなかったので、どんどん新しい機能が追加されてるんですね。
例えば、最近のAIニュースの投稿を追加したいとします。natural20.beehive.orgの「製品プレイスメント」というやつです。「挿入」をクリックすると、たくさんの異なるソースを読み込めます。一つだけじゃなくて、いくつも追加できるんです。全部を組み合わせて見てくれます。
長い間、このツールはテキストだけでした。チャットして質問したり、FAQを作ったり、勉強ガイドを作ったり、タイムラインや概要文書、目次を作ったりできました。特定の質問にも答えられて、必要な情報を正確に見つけるのがとても上手でした。
でも、このオーディオ概要のセクションが新しいんです。今、多くの人が興奮してるのがこれなんです。今話題になってる「AIポッドキャスト」ってやつです。深掘りの会話を生成できます。今のところ二人の司会者で、英語だけです。司会者は固定で変更できませんが、Googleには似たような製品で「Illuminate」というのがあって、そっちではインタビューの司会者やゲストを選べるようになり始めてるんです。
カスタム指示を与えられるようになって、その機能が使えるようになれば、多くの司会者やゲストから選べるようになると思います。今はまだできませんが、きっとすぐにできるようになるでしょう。
新しくて面白いのは、「カスタマイズ」をクリックすると、オーディオ概要を設定できることです。AIの司会者に何に焦点を当てさせるか、特定のソースや特定のトピックに焦点を当てさせたり、特定の聴衆をターゲットにしたりできます。
Illuminateでは、これがあらかじめ入力されてて、「一般的な聴衆向けの短い議論を作成し、トーンは半専門的に」とか設定できます。これを変更して、「専門家向けの長い議論で、トーンは非常に専門的に」とかにもできます。
一つ気づいたのは、Illuminateでは時間の長さについて説明があります。短いのは5分未満、中くらいは5〜10分、長いのは10分以上です。ここでもその指示に従うみたいですが、必ずしもそうじゃないかもしれません。短いポッドキャストを頼むと、過去には上手くいったことがありますが、毎回というわけじゃないんです。ポッドキャストの長さについての指示をどれだけ重視してるのかはよく分かりません。
例えば、ここで「短い時間のポッドキャストを作って、猫のジョークをたくさん入れて、最後は暗くて悲しい感じで終わらせて」なんて指定できます。なぜって? まあ、そうしたいからです。それで「生成」をクリックすると、通常は数分かかります。
生成中の間、HeyGenというツールを見てみましょう。これはおそらく、ビデオ専用のAIアバター生成プラットフォームではトップのユーザー数を誇ります。他にもありますが、機能の面ではこれが一番多いと思います。有料ですが、遊んでみたい人のために無料プランもあります。ただし、より高度な機能を使いたい場合は月額料金がかかります。
インタラクティブなアバターや、往復のやり取りができたり、パーソナライズされたビデオを作ったりできます。例えば、誰かが製品やサービスに登録するたびに、「ボブさん、Xという製品に登録してくれてありがとうございます。楽しんでいただけると嬉しいです」というビデオを送りたい場合、これを使えます。自分の動画をアップロードして、メールのフィールドから名前などの情報を取得すれば、その名前を言うようにできます。まあ、これが悪用されることは絶対にないでしょうね。
写真も使えます。何の写真でもOKです。写真のアバターを使って、それに命を吹き込むこともできます。非現実的な写真を使うので、モナ・リザをアップロードしたいなら、それも可能だと思います。
Notebook LMのために何か作りたい場合、私がやるのは、男性と女性の別々の動画を作ることです。往復のやり取りをするからです。やり方は、「ビデオの作成」をクリックして、「アバタービデオ」を選びます。例えば、横長の動画を作りたいとします。
左側で、何十億ものアバターから選べます。正確な数は分かりませんが、今では50くらいはあると思います。中には異なるポーズや背景を持つものもあります。
タイムラインの下に、例えば「world coin audio」を追加します。そして、音声の長さとアニメーションの長さが合っていることを確認します。とてもシンプルで分かりやすいです。アニメーションが音声より長い場合は、「本当にそれでいいですか?」と通知が来ます。そうしないと、アバターが10秒間音声なしで何もせずに座っているだけになってしまいますからね。
完成したら、「送信」をクリックして、好きな名前を付けて送信します。通常、ビデオの作成には少し時間がかかります。
現在、私がやっているのは、男性と女性の別々の動画を作って、それを何らかのビデオ編集ソフトで切り貼りして、交互に切り替わるようにすることです。AIを使ってこれを自動でやってくれるツールがあるはずです。話している人に切り替わるようなものです。
HeyGen自体にも、全部をつなぎ合わせる方法があります。ただし、そこに座ってやる必要があります。もし誰か、音声に基づいて話している人に自動で切り替わる、ワンクリックでできるようなツールを知っていたら、コメントで教えてください。そういうのがあれば、作業がずっと楽になるんですが。
自分だけのビデオポッドキャストや単独のポッドキャストを作りたい場合、こんな感じでやります。Notebook LMで音声を作成し、ビデオが欲しければHeyGenのようなものを使ってアバターを追加します。視覚的な要素を加えたい場合は、ビデオ編集をして上に追加する必要があります。
これらのツールの多くにはAPIがあるので、例えばHeyGenを使えば、多くの部分を自動化できるでしょう。つまり、AIで生成されたポッドキャストやビデオに需要があれば、想像できるあらゆるトピックについて大量に生産できるようになるということです。
これは当然、様々なTwitterやYouTube、Instagramを大量のコンテンツで溢れさせることになるでしょう。数週間前、いや、もう1、2ヶ月前になるかな、これについて初めて取り上げたときに言ったんですが、この波が来ているんです。
具体的にどう影響するかはまだはっきりしませんが、昔はビデオ制作がめちゃくちゃ高額やったんです。ビデオ制作は難しくて、高くついて、照明やマイク、機材を持った人がおらなあかんかったんです。でも今や、ボタン一つで、ある意味ではより良いものが作れるんです。
Deep Diveの司会者の声を聞いてみ? どんな話題でも、あの話し方はほんまにすごいですわ。わたしもあんな風に話せたらなぁって思います。それに、全ての単語を完璧に発音してはるんです。一度も発音間違いしたことないんちゃうかな。
コメント欄でよく指摘されるんですけど、わたしはよく発音を間違えるんです。ほとんどの情報を読書で得てるからなんです。だから、ある単語を読んでも、発音を聞いたことがなかったら、こう発音するんやろなって勝手に思い込んで、カメラの前で何度も何度も言うてしまうんです。そしたら、何百万人もの人に間違いを指摘されるんですわ。すごいことですよね。
でも、開発者の言うとおり、これは新しいメディアみたいなもんやと思うんです。新しいメディア形式というか。わたしたちが違うメディアを聞いたり見たりするのは、違う目的があるからですよね。エンターテイメントのためやったり、仲間意識を感じるためやったり。
Twitchのストリーマーを見てみ? 一日中ゲームをプレイしてるだけなのに、すごく強くて発達したコミュニティがあるんです。人々はそこに行って、おしゃべりして、お互いを知り合うんです。Twitchのストリーマーは、そのグループのリーダーみたいな感じです。
必ずしもゲームプレイを見るために行くわけやないんです。普通、ライブじゃない時は、そんなに大きなフォロワーはおらへんのです。ライブでプレイしてて、みんながライブで参加するからこそ、何か特別なものがあるんです。AIのアバターではそういうのは難しいかもしれませんが。
例えば、ニュース局がときどき少し偏った見方をしたり、ある政治的な立場を押し付けたりするのにイライラすることがあるでしょ? 自分の考えを押し付けるんじゃなくて、ただニュースを伝えてほしいと思うことない?
そんな時、自分だけのニュースフィードを作れるんです。カスタマイズしたAIアバターを使って、ネガティブなことや偏見、商品の宣伝、広告なしで情報を提供してくれるんです。
そういうツールが出始めてるんです。実際、訴訟も起きてます。例えば、Perplexityという会社がニューヨーク・タイムズか他の大手出版社から訴えられてると思うんです。ニュース局のコンテンツを利用して自分たちが儲けてるって言われてるんです。
ニュースを検索すると、その記事やどのサイトの記事でも読み取って、出来事の要約を提供するんです。でも、ジャーナリストやオフィスの人たちが実際に外に出て、人間を使ってニュース記事を作るのにはたくさんのお金がかかるんです。
それをコピペしたり、AIで要約したりするのは安上がりですが、エンドユーザーにとっては同じくらい価値があるんです。そうやってたくさんのお金を稼げるんです。確かに利益率の高いビジネスですよね。
これがどこに向かうのか、答えなきゃいけない質問がたくさんあります。多くの人々に、自分たちのコンテンツを作る力を与えることになります。他の人のためでも、自分自身のためでもね。
ここで重要なのは、わたしたちは未知の領域に足を踏み入れてるってことです。そして今、Googleが実際にNotebook LMのパワーアップ版みたいなものを企業ユーザー向けにリリースしようとしてるんです。おそらくもっと多くの機能を備えたものになるでしょう。
Content Studioって呼んでたと思うんですけど、裏でいろんなものを開発してるんです。考えてみてください。YouTubeも持ってるんですよ。AIのニュースチャンネルを24時間走らせて、様々なニュースを取り上げるのは、めちゃくちゃ儲かるはずです。AIで生成するなら、コストもほとんどかからへんし。
Googleやから、もうデータは全部持ってるんです。ウェブをクロールする基盤はもうあるんです。今や、それを要約して、好きな形式で提示するものも持ってるんです。音声でも動画でも何でも。まだ動画の機能はないですけど、2025年くらいには、HeyGenと同じようなものを持ってても全然驚きませんわ。
最近、AIの分野で本当に高度なものをめちゃくちゃ速くリリースしてるんです。これは大きな波が来てるってことで、わたしたちを飲み込もうとしてるんです。多くのものを変えようとしてて、それにどう適応していくかっていう疑問がたくさん出てきます。
人々はAIアバターに、人間のコンテンツ提供者と同じように反応するんでしょうか? 結局のところ、画面上のピクセルなんですけどね。このチャンネルのコメントを見てると、半分くらいの人がわたしがAI生成だと思ってるみたいです。違いますよ。目の下のクマを見たら分かりますって。十分な睡眠が取れたらね。
でも、すぐにそれを見分けるのが難しくなるでしょう。今のところ、AIで生成されたのか分からないチャンネルの例を見つけられてません。まだその線は越えてないんです。必ず何かおかしいところがあるんです。
でも、ここ6ヶ月くらいで、もうすぐその線を越えそうなくらい近づいてるんです。数ヶ月以内、確実に半年以内には越えるでしょう。そしたら、見てるものが本物の人間なのか分からなくなるんです。
経済的に見ても、人間のコンテンツを作るよりもずっと安くて、利益が出て、簡単なんです。そして、多くの面で人間のコンテンツよりも優れてたり、少なくとも平均的な人間のコンテンツよりは良かったりするんです。
みんな、司会者の声が心地よくないポッドキャストを聞いたことがあるでしょ? 「これ聞けへんわ」って思うようなやつ。あと、「えーと」を何回も言ったり、考えの間に長い間があいたりする動画を見たことない?
時々はいいんですけど、「もう2024年やで、みんなADHDやのに、そういうとこカットせなアカンやろ」って思うことありますよね。
つまり、平均的な人間が作るコンテンツは、もう多くの面でクオリティや照明、音質なんかの点で劣ってるんです。
何万人もの人がこれを効果的に作る方法を見つけたらどうなるでしょう? 100万人が見つけたらどうなる? お金もかからへんし、誰でもできるんです。
わたしたちが100%準備できてるかどうかは分かりません。でも、ここまで見てくれてありがとうございます。頑張ってくれましたね。是非チャンネル登録してください。サムズアップボタンも押してくださいね。
これからもっとたくさんのコンテンツが来ます。これはまだ始まったばかりです。まだまだ初期段階ですよ。わくわくするし、ちょっと怖いところもあります。この新しいAIの世界の発見の旅に参加させてくれてありがとうございます。
わたしはウェス・ロスです。また次回お会いしましょう。
この記事が気に入ったらサポートをしてみませんか?