見出し画像

Google NotebookLM:開発秘話と将来展望


 GoogleのNotebookLMは、2023年に実験的プロダクト(Experimental Product)としてリリースされ、今年10月に“Experimental”ステータスが外れ、正式版としてリリースされた現在無料で利用可能なツールです。

 このNotebookLMは、ノートブックアシスタントとしての位置づけのプロダクトで、PDFや文書、音声、URLなど、異なる種類のマルチモーダル・データを同時に扱うことができ、コンテンツの整理、要約、FAQの生成など、ユーザーが情報を効率的に扱えるようサポートする機能を提供しています。特に注目されているのは、自然言語データを基にポッドキャストのシナリオを自動生成し、流暢な英語の話し言葉で音声出力する「オーディオ・オーバービュー」機能を提供しており、この機能は市場から高い関心を集めています。
 
 この投稿は、このNotebookLMの開発チーム・メンバーを迎えてのセコイア・キャピタルのインタビュー・プログラムを参考訳で紹介するものです。
 インタビューでは、NotebookLMがGoogleの20%ルールを活用したボトムアップのプロジェクトとしてスタートし、音声モデルを含むGemini 1.5 Proの高度なデータ処理技術を基盤として開発が行われ、当初の期待を超えて成長しているプロジェクトであることが紹介されています。現在、NotebookLMは、情報管理やリサーチ効率化のためだけではなく、企業のセールスチームや教育分野での活用も進んでおり、大量のトレーニング資料や教科書を簡単にまとめ、音声化することで効率的に学習や情報共有を促進するようなユースケースが広がっているとしてます。
 将来的には、より細かい調整を可能にする機能や動画出力などの追加開発も視野に入れており、さらなる進化が期待されているプロダクトとしています。

[主だったサブテーマ]

  • NotebookLMのオーディオ・オーバービュー

  • 開発背景と技術的基盤

  • ユースケースと普及要因

  • 今後のプロダクト構想と展望






1. インタビュー


 [ソーニャ・ホァン](Sequoia Capital)
 2週間前、Googleが発表した謎の実験的なプロダクト「Notebook LM」が話題となりました。このAIを使ったライザーチツールは、どんな素材からでも驚くほどリアルで、時にはユーモラスなポッドキャストを作成できると評判です。本日は、GoogleのNotebook LMのプロダクトリードであるライザ・マーティンさんと、デザインリードのジェイソン・スピールマンさんをお招きしています。Notebook LMのアイデアの源や開発プロセス、大企業であるGoogle内でどのようにプロジェクトが進んでいったのか、そして予想外の利用方法や今後の展望についてお話を伺います。


[ソーニャ・ホァン](Sequoia Capital)
 ライザさん、ジェイソンさん、本日はお越しいただきありがとうございます。AIによるポッドキャストホストが世界を席巻して、私たちの仕事を奪ってしまう前に、こうしてお話できて嬉しいです。よろしくお願いします。


[ライザ・マーティン](Google)
 ありがとうございます、こちらこそ呼んでいただき光栄です。


[ソーニャ・ホァン](Sequoia Capital)
 まずお伺いしたいのですが、Notebook LMは「Google版ChatGPT」と呼ばれていますよね。このプロダクトはまだプレビュー段階にもかかわらず、すでに話題となり、GPUsがフル稼働状態だとか。そういった見方について、どう感じていますか?
 

[ライザ・マーティン](Google)
 そうですね、ChatGPTが私にとってもかなり大きな存在だったので、それに比べられるのは「え、そんなに?」と少し驚く部分もありますが、多くの方が「これがAIか!」と強く感じているのは事実です。そういった反応を見るのは、とても嬉しいですね。


[ジェイソン・シュピールマン](Google)
 私も同感です。最初に音声概要を聞いたとき、特に2人目のホストが登場した瞬間は本当に衝撃的でした。でも、やはり背後には、Gemini 1.5 Proが非常に複雑な情報を処理して、それを非常にわかりやすくまとめてくれているという技術があって、その組み合わせが、やはり驚くべき瞬間を生んでいるんだと思います。
 

[ソーニャ・ホァン](Sequoia Capital)
 リスナーの皆さんに向けて、まだNotebookを使ったことがない方のために、Notebookってどんなものなのか教えていただけますか?
 

[ライザ・マーティン](Google)
 そうですね、NotebookはAIを活用したライザーチと執筆のツールです。ただ、今では「ソースをアップロードすると、音声概要やポッドキャストを生成してくれるツール」として知られることが多いですね。
 

[ソーニャ・ホァン](Sequoia Capital)
 その機能は偶然生まれたんですか?最初からポッドキャストのホストに取って代わるようなツールを作るつもりだったのでしょうか?
 

[ライザ・マーティン](Google)
 正直なところ、私たちは常にさまざまなアウトプットの形式に取り組んでいました。次のステップとして「音声」を選び、対話形式にしました。それがポッドキャストのホストに匹敵するものになるとは、当初は想像していなかったですね。確かに「これは魔法みたいだ」とは思いましたが、こんなに多くの人に好意的に受け入れられるとは、嬉しい誤算でした。
 

[パット・グレイディ](Sequoia Capital)
 Notebook LMに関しては、開発に時間がかかっていたと思いますが、最初のアイデアやプロジェクトの始まりについて教えていただけますか?
 

[ライザ・マーティン](Google)
 そうですね、私は昨年「AI Test Kitchen」で仕事をしていたのですが、Notebookは実は20%プロジェクトから始まりました。当初、1人のエンジニアが「Talk to Small Corp」というものを開発していたんです。これがまた面白い名前ですよね。
 

[パット・グレイディ](Sequoia Capital)
 確かに、ユニークなブランド名ですね。

[ライザ・マーティン](Google)
 「コーパスって何?」って感じでしたけど、彼と話すうちに、「大規模言語モデル(LLM)を使ってデータと対話し、情報を引き出すアイデアだよ」と言われたんです。それを聞いて「おお、これは面白い」と思いました。そして、実際の応用について考え始めました。私は大人になってから学校に通った経験があるので、「もしLLMを使って、教科書のようなものと対話できたらどうだろう」と考えました。それは自分の人生を変えるし、他の人の人生も大きく変える可能性があると思ったんです。そこから、このプロジェクトを進めて、2023年5月に「Project Hwind」として初めて公開しました。その時は、ソースをアップロードして、それに対してチャットができるという形でした。
 

[ジェイソン・シュピールマン](Google)
 そうですね、このプロダクトが他と一線を画しているのは、ソースに基づいた機能だという点です。私自身、最初にこのプロジェクトを考え始めた時は、すべてのクリエイティブな作業には何かしらの既存の資料や文書がベースになっていることに気づきませんでした。今では、このツールを「ソースに基づいたクリエイティブなツール」と呼んでいますが、将来的には、他のさまざまな分野でも使えるツールになっていくと思います。
 

[ソーニャ・ホァン](Sequoia Capital)
 Notebook LMの統計について、何かシェアできることはありますか?
 

[ライザ・マーティン](Google)
 そうですね、音声概要をリリースする前から順調に成長していたのですが、リリース後は急速に加速しました。これが人々を引きつける良いきっかけになったんです。そして面白いことに、音声概要をきっかけに使い始めた人たちが、他の機能を使い続けているのも興味深いですね。Notebookから何を得たいのか、皆さんがどんどん探求している様子が見られます。
 

[ソーニャ・ホァン](Sequoia Capital)
 ポッドキャストや音声概要の体験はまさに魔法のようです。どのようにしてそんなリアルな対話を作り上げたのか、少し舞台裏を教えていただけますか?対話が非常に魅力的で引き込まれる感じがしますが、どうやって実現したのでしょうか?
 

[ライザ・マーティン](Google)
 まず言っておきたいのは、これは大変な作業で、多くのチームメンバーが関わったということです。そしてその中心にあるのはGoogleのモデルです。Notebook LMにデータを入力すると、Gemini 1.5という驚異的なモデルがそれを処理し、新しいものを生成します。それに加えて、音声モデルやオーディオモデルがNotebook LMを支えています。そして、これらの基盤にあるのが「コンテンツスタジオ」というツールで、これがユーザーのコンテンツをポッドキャストに変える際の編集的な役割を果たしています。多少の編集の自由度を持たせていますね。
 

[ソーニャ・ホァン](Sequoia Capital)
 今後、その「スタジオ」をユーザーが使えるようにして、「もっと面白くして」「もっと真面目に」など調整できるようにする可能性はありますか?
 

[ライザ・マーティン](Google)
 そうですね、そのリクエストはよくいただきます。多くの人が使って楽しんでいるので、次は「調整できるようにしてほしい」という声が出てくるんです。私も最初はすぐにその機能を追加したいと思いましたが、もう少し慎重に考えています。皆さんがNotebook LMを気に入ってくれたのは、その「魔法のような体験」だからです。どうやってその魔法を保ちながら、調整機能を提供できるかが重要だと考えています。まだ模索中ですが、実現したいと思っています。
 

[ジェイソン・シュピールマン](Google)
 確かに、音声概要が急速に広まった要因の一つは、そのシンプルなワンクリック体験だと思います。実際、私の祖母に使い方を説明しようとした時も、ほとんど説明がいらなかったんです。「ソースをアップロードして、このボタンを押すだけ」と言えば、すぐに理解してくれました。この簡単さが、爆発的な成長を後押ししたと思います。だからこそ、調整機能を追加する際も、意図的でシンプルな形にしたいと考えています。
 

[ライザ・マーティン](Google)
 それに、楽しくなきゃいけないですね。
 

[ソーニャ・ホァン](Sequoia Capital)
 音声概要を目当てに来た人たちが、他の機能も使い続けているとのことですが、「他の機能」で特に興味深い利用ケースはありますか?
 

[ライザ・マーティン](Google)
 そうですね、個人的に驚いたのは、教育的な利用です。学生や教育者がNotebook LMを使っているのを多く見かけますが、一番意外だったのは、仕事で使っている方が多いことです。例えば、Google社内の広告チームで行ったパイロットケーススタディでは、広告セールス担当者がNotebook LMを使っていました。彼らのトレーニング資料は何百ページもあり、それが頻繁に更新されるため、全てを把握して販売するのはとても大変なんです。以前は同僚に「これどうやって使うの?」と質問し、その回答をメールにコピペしてやりくりしていたそうです。
 でも今は、知識を持った人がノートブックを作って、それをセールスチームに配布しています。それを使うことで、何百人もの担当者が同じ資料を参照できるようになり、質問のやり取りが減りました。シンプルなケースですが、これがどれほど便利かに驚きましたし、そこからさらに多くの可能性が広がっていくと感じました。
 

[ジェイソン・シュピールマン](Google)
 実はちょうど、セールスに携わる友人と話していたのですが、「Notebookで一つのノートを作っておけば、電話中に答えがわからないときでもすぐに聞いて返事を得られるので、とても便利だ」と言っていました。このような知識の分散のアイデアは、大規模なセールスチームやデータセンターなどで非常に役立っていると思います。また、興味深い利用例として、ベンチャーキャピタルやプライベートエクイティ(PE)に従事する友人が話してくれた「秘密情報覚書(CIM)」があります。彼にとって、それが仕事の大部分を占めているそうで、「受け取ったドキュメントやスライドをNotebookに入れて、複雑な情報を以前よりはるかに速く確認できるようになった」と話していました。彼は仕事のスピードが10倍にアップしたと言っていて、すごく喜んでいましたね。
 

[ソーニャ・ホァン](Sequoia Capital)
 ポッドキャストホストやベンチャーキャピタル—私たちの仕事を奪おうとしてるんですね
 

[ジェイソン・シュピールマン](Google)
 いやいや、お手伝いしてるだけです
 

[ソーニャ・ホァン](Sequoia Capital)
 今までで一番驚いた瞬間は何でしたか?私は、AIホストが自分がAIだと認識した瞬間がとても面白かったんですけど、皆さんがこれまでに驚かれた瞬間を教えてください。
 

[ライザ・マーティン](Google)
 私から始めますね。先週末のことです。寝る前に、Twitterを見ていたんです(ちなみに今は*X*ですね)。おそらく、寝る前にTwitterをチェックするのは健康的じゃないんですけど。
 

[ソーニャ・ホァン](Sequoia Capital)
 スクロールしてたんですね。
 

[ライザ・マーティン](Google)
 そうなんです。それで「Poop Fart」の件を見つけたんですよ。まだ聞いたことがない人は—いや、ほんと、ぜひ聞いてほしいです。
 

[ジェイソン・シュピールマン](Google)
 これはとても重要な話題ですね。「Poop Fart」を聞いていない方は、ぜひ理解してほしいんです、これがどれだけ魔法のようなものか。
 

[ライザ・マーティン](Google)
 簡単に説明すると、誰かがドキュメントをアップロードしたんですが、そのドキュメントの中身が「poop」と「fart」という単語だけで埋め尽くされていたんです。結構長いドキュメントだったんですが、その2つの言葉がひたすら繰り返されていて。「これは一体何だ?」と思いつつ、夜11時にそれを聞くか迷いました。もし問題があったら、バグ報告してエンジニアを呼ばなきゃいけないので。でも聞いてみたら、もう信じられないくらい良かったんです。
 

[ジェイソン・シュピールマン](Google)
 私も見たときに「これはやばい」と思いました。でも実際に聞いてみたら、期待以上で本当に素晴らしかったんです。
 

[ライザ・マーティン](Google)
 その時は「よくやったね、Notebook」って感じでしたね。小さなヒーローです。
 

[ジェイソン・シュピールマン](Google)
 的確に問題を解決してますよね。
 

[ソーニャ・ホァン](Sequoia Capital)
 デザインの選択についてですが、Notebookが直感的に使いやすい理由は何ですか?
 

[ジェイソン・シュピールマン](Google)
 そうですね、まだ決定を進めている段階ですが、現時点では、迅速にリリースし、ユーザーのフィードバックをもとに最適化していくというアプローチを取っています。今のテクノロジーの進化は非常に早く、何が可能かを常に把握するのは難しいです。だからこそ、素早くリリースし、ユーザーと共に最適なプロダクトを作っていくというモデルを目指しています。ただ、具体的に言うと、幸運なことに「左側のソースパネルを明確にしたこと」が重要だったと思います。私たちのプロダクトは「ソースに基づいた」もので、アップロードしたソースを元に対話していることを明示するのが大事でした。また、音声概要がワンクリックで生成できるというシンプルさも成功の要因だったと思いますが、今後さらに多くの機能を追加していく予定です。
 

[ライザ・マーティン](Google)
 デザインの選択やプロダクトの優先順位に関して言えば、「新しいものをどう直感的に使えるようにするか」を真剣に考えることが重要です。特に、最初にソースをアップロードするというステップは、ユーザーにとってハードルになりがちなんですよね。「なぜソースをアップロードする必要があるの?」って。ChatGPTやGeminiではアップロードせずに使えますから、そういう「自然に使える」感覚に関しては、まだやるべきことが多いですね。
 

[ソーニャ・ホァン](Sequoia Capital)
 この新しいAIネイティブな体験を広めていく中で、今後最大の課題は何だと思いますか?
 

[ジェイソン・シュピールマン](Google)
 今のAIデザインの時代は、いわゆる「スキューモーフィズム」の時代だと思います。スキューモーフィズムというのは、仮想のオブジェクトが現実世界のオブジェクトを反映している状態のことです。これは初期のiOSにも見られましたよね。アプリの上部が革のようなデザインで、メモパッドが黄色だったりして、物理世界から仮想世界へユーザーをスムーズに移行させるために作られていました。今、AIでも同じようなことが起きていると感じています。私たちも、新しい、ちょっとクレイジーな体験を提供しようとしつつ、多くのユーザーにとってAIとの初めての接触点でもあることを理解しながらデザインしているところです。
 

[ソーニャ・ホァン](Sequoia Capital)
 MidJourneyが、いわゆる「ブランク・ウォール・プロンプト問題」をうまく解決していると思うんですが、そういったUIの課題にうまく取り組んでいる他のアプリケーションで、感銘を受けたものはありますか?
 

[ライザ・マーティン](Google)
 一つありますね。最近試してみた「Pika」というアプリがとても気に入っています。Pikaでは、画像をアップロードすると、どのように加工されるかを事前にプレビューできるんです。例えば「ケーキ」に変換するというエフェクトがあって、私は飲み物の写真をアップロードして「ケーキにして」ってお願いしました。その飲み物がケーキに変わるのを待っている間、ワクワクして「どうなるかな?」と期待が高まりました。これは、ユーザーに「次に何が起こるのか」を示すことで、彼らの期待を高め、積極的に行動させる要素があると思います。正直、すぐに「これに10ドル払うよ」と思ったほどです。
 

[ジェイソン・シュピールマン](Google)
 私は「Cloud Artifacts」が大好きです。共創にフォーカスした素晴らしい取り組みだと思います。私たちは以前から執筆や共創について話してきましたが、他の分野でも同じように考えているのを見るのは素晴らしいことです。AIと人間の間のヒエラルキーを平等にしたいという点で、Cloud Artifactsは完璧な例だと思います。チャットしながら、右側で新しいものを作り始めることができるのもとてもクールです。
 

[ソーニャ・ホァン](Sequoia Capital)
 Cloudと比較して、Notebook LMのアプローチについてはどう思いますか?似ている部分もありますが、違いはどこにあると思いますか?
 

[ジェイソン・シュピールマン](Google)
 現時点で言うと、私たちはソースに基づいたツールという点で差別化されています。それが最も大きな違いだと思います。ただ、私たちも、アップロードされたソースを活用して、広くクリエイティブな作業をサポートすることに力を入れています。
 

[ライザ・マーティン](Google)
 そうですね、その点に関して、LLMの文脈を活用することは非常に強力だと思いますし、それがユーザー体験をより粘り強くするとも思います。ClaudeやAnthropic、OpenAI、Googleもこのことを理解していると思いますが、いつ、どのタイミングでそれを導入するかが課題です。Notebook LMは最初からソースに基づいたワークフローに着手しているので、このツールがユーザーが求めているものになる可能性が高いですね。他の企業がさまざまなケースに取り組んでいる間に、私たちはこの方向に全速力で進んで、さらに先を目指したいと思います。
 

[ソーニャ・ホァン](Sequoia Capital)
 以前、AIのスキューモーフィックなインターフェースとしてチャットを挙げていましたが、もっと「クレイジーな」体験について実験しているとおっしゃっていました。どのようなものになるのか、少し教えていただけますか?
 

[ジェイソン・シュピールマン](Google)
 今のところ、動的なUIにすごく興味があります。Claudeはその一例で、最初はなかった要素が後から追加されてくるような体験が面白いですね。Notebook LMは、リーディングやライティングといった多くの機能を提供しようとしているので、ユーザーが圧倒されないように、その瞬間に何をしているのかに応じて適切な体験を提供できるように工夫していきたいと思います。
 

[ライザ・マーティン](Google)
 私自身、最近は新しいモダリティにもっと注力しています。つまり、入力と出力の観点から見て、それが何を意味するかを考えています。自分でも多くのプロトタイプを作り、試行錯誤していますが、最近のお気に入りは「歩きながら話す」というアイデアです。AIとのエコシステムで、日記のようなやりとりをして、私が話す内容をもとに日記を作成してくれるというものです。その結果、「今週は良い日より悪い日が多かった」とか、「これが自分を幸せにしたもの、これがイライラさせたもの」といったビジュアルを生成してくれます。こうした個人的な利用も、非常に魅力的だと感じています。こういった学びをNotebook LMにどう活かすかを考えていて、特にモバイルアプリに反映される可能性があるかもしれません。
 

[ソーニャ・ホァン](Sequoia Capital)
 Notebook LMが一躍注目を集めていますが、これからどこに向かっていきたいと考えていますか?
 

[ライザ・マーティン](Google)
 正直に言えば、ただ「続けたい」です。もっと素敵なものを作り続けたいです。ユーザーの体験をさらに深めて、本当に役立つものにしていきたいですね。今は多くの魔法のような驚きがあり、それを持続させることで、最初のインパクトをさらに強化し、「これを使い続けると、もっと素晴らしいことが待っている」とユーザーに示したいです。
 

[パット・グレイディ](Sequoia Capital)
 今の製品で、最も欠けていると思うものは何ですか?
 

[ライザ・マーティン](Google)
 もし過去に戻って、もっと多くの機能を今回のリリースに追加できるとしたら、シェア機能を改善したかったですね。*X*をスクロールしていると、ユーザーが私たちのネイティブな機能ではなく、別のビデオやビジュアライザーを使っているのを見ることがよくあります。それを見ると、「ああ、このユーザーの利用状況を計測できていないんだな」と思うんです。ですから、今足りないのは、音声概要を共有し、コラボレーションできる機能だと思います。
 

[ジェイソン・シュピールマン](Google)
 私も、ライティング機能の追加にはとてもワクワクしています。多くのユーザーがQ&Aを行い、その回答を元に新しいものを作り出していることを知っていますから、その全体のユーザージャーニーをサポートできるのが楽しみです。
 

[ソーニャ・ホァン](Sequoia Capital)
 どうやってAIに、例えば「会話調で」とか「面白く」など指示しているのでしょうか?技術的にはどのようなことをしているんですか?
 

[パット・グレイディ](Sequoia Capital)
 そうですね、どうやってパーソナリティをデザインしているのか、私もすごく気になります。
 

[ライザ・マーティン](Google)
 裏ではたくさんのことをやっていますが、特に良い点を指摘されたと思います。番組の名前は*Deep Dive*ですから、明らかに2人のホストがいます。実際、そのホストたちが番組を作る際には、かなりの編集の自由を持っていて、アップロードされたソースに基づいてどんな方向に話が展開するかを見るのが、私自身も毎回楽しみなんです。
 

[ソーニャ・ホァン](Sequoia Capital)
 なるほど、各ソースに独自のパーソナリティやアプローチを与えて、それがポッドキャストを生成しているわけですね?
 

[ライザ・マーティン](Google)
 そうです。簡単に言えば、それが私たちのやっていることの核心ですね。編集体験を考えると、まさにその通りです。
 

[ソーニャ・ホァン](Sequoia Capital)
 その場合、どんな調整ができるんですか?
 

[ライザ・マーティン](Google)
 もちろん、基本的なこととして「Deep Diveではなく、別の形式の番組がいい」とか、「もっと短いのがいい」「もっと長いのがいい」「特定のトピックだけにフォーカスしたい」といったリクエストに応えることができます。今は音声概要をベースにしていますが、そうした細かい調整をどんどん可能にしていきたいと考えています。でも、その中心にあるのはやはり、ソースに基づいた編集の自由度と、それを使って全体をまとめ上げる体験ですね。
 

[ソーニャ・ホァン](Sequoia Capital)
 毎回「君が私たちの仕事を奪うんじゃないか」と冗談を言うと、君は「そんなことはない」と言ってくれるけど、それってただ優しく言ってくれているだけなんじゃないかって思うんです。君が作ったものは本当に素晴らしいんです。だから、本当の質問として聞きたいのは、「本物のポッドキャストを置き換えるほど良くない」と言うけれど、それはどうしてなんですか?私には本物のポッドキャストを置き換えるのに十分だと感じられるんです。


[ライザ・マーティン](Google)
 面白い質問ですね。何度か冗談で「私たちの仕事を奪う」と言われていますが、私はその可能性について慎重に考えています。もし実際にリスクがあるなら、しっかりと向き合い、それにどう対処するかを考えたいです。ただ、現状を見ていると、ユーザーが作っているものは、いわゆる「本物のポッドキャスト」とは少し違うんです。例えば、好きなポッドキャスト『Lenny's』を、単なる記事を元にして作り替えたいとは思いません。*Lenny*の考えを聞きたいのであって、ただの情報をまとめたものでは満足できないんですよね。
 一方で、音声概要で作成されているものは、履歴書やLinkedInのプロフィール、スタートアップのランディングページなど、個人的でユニークな用途が多いです。これらは、通常のポッドキャストでは扱わないような内容ですよね。それがすごく面白いところで、個人のニーズにぴったり合った生成コンテンツを提供できていると感じます。これは既存のポッドキャストとは異なる体験で、非常に特別なものだと思います。


[ジェイソン・シュピールマン](Google)
 確かに、新しいメディアの形態のように感じますね。見た目や音はポッドキャストのようですが、実際は全く異なる多彩な用途で使われています。ネットでリアクション動画が人気なのも同じ理由だと思います。リスナーは私たちが話す内容だけでなく、この分野で活躍しているあなたたちの考えや反応を聞きたいからこそ、私たちのポッドキャストを聞いてくれているんだと思います。それも、ポッドキャストが登場したときの重要な要素でしたよね。
 

[ライザ・マーティン](Google)
 面白いのは、みんなが作っている音声概要は非常にパーソナルなものだということです。履歴書の音声概要を作っても、それを他人に聞かせるためではなく、自分のために作っています。自分の履歴書の音声版に喜びを感じているわけです。TikTokで、2004年の日記をアップロードして音声概要を作った女性の動画もあって、それを聞くこと自体も面白かったんですが、実際は彼女自身がその日記に対してどんな反応をするかが特別だったんです。誰も彼女の日記についてのポッドキャストを聞きたいとは思わないかもしれませんが、そのリアクションが彼女にとっての特別な体験なんです。私のお気に入りの利用ケースの一つですが、最近、ある人が大学の友達とのグループチャットが週末に爆発的に盛り上がったと言っていました。彼はメッセージを全部読むのが面倒だったので、すべてをドキュメントにコピーして、「月曜の朝、出勤途中にこれを聞いてみよう」と思ったそうです。これがまさに、パーソナライズされた生成の力だと思います。
 

[パット・グレイディ](Sequoia Capital)
 チャットボックスが主流の中で、「人々が音声形式でこのコンテンツを消費したい」と思う発想はどこから生まれたのでしょうか?
 

[ライザ・マーティン](Google)
 それは、ジェイソンが言っていた「新しいものを既存のフォーマットで届ける」ことに関係しています。ユーザーがすぐに理解して試してみたくなる形で提供することが重要でした。私たちは「ソースをアップロードして、何か新しい音声コンテンツを生成する」プロセスを考えたとき、「どんな音声コンテンツが生成できるだろう?」と考えました。非常に強力な音声モデルを持っていたので、モノローグやダイアログ、ユーザーが切り替えできる機能を試してみました。結局、人々に最も響いたのはダイアログ形式で、「あ、これポッドキャストだ!」と認識されました。それは単にテキストを読み上げるだけのものではなく、予想外の驚きがあり、それが人々に喜ばれたんです。それで「これが正解だ」と感じました。
 

[ソーニャ・ホァン](Sequoia Capital)
 今やポッドキャストの機能が非常に強力で、汎用性も高いプロダクトになっています。今後はどちらに進んでいくつもりですか?ポッドキャスト機能をさらに深めていくのか、それとも他の展開を考えていますか?
 

[パット・グレイディ](Sequoia Capital)
 YouTube動画はいつ出ますか?
 

[ライザ・マーティン](Google)
 そうですね、コストの問題が大きいですね。
 

[ジェイソン・シュピールマン](Google)
 今は入力としてそういったメディアを使えますが、出力に関しては、まだ少し作業が必要です。
 

[ライザ・マーティン](Google)
 そうですね、ただロードマップ自体はわりと明確だと思います。もちろん、明日何か予想外のことが起きない限りですが。私たちは「あなたにとって重要なすべての入力を取り込み、それをAIの力で何か新しいものに変える」という約束を果たしたいと思っています。ポッドキャストは間違いなく、その中で深く掘り下げたい出力の一つです。ユーザーがこの機能に非常に関心を持っていることがわかっていますから。でも、それだけでなく、もっと実用的なものも提供したいと考えています。ユーザーの好みはさまざまですからね。2日前に、誰かが「コードの出力をもっと良くしてくれませんか?」と言っていたんです。「ポッドキャストは素晴らしいけど、もっと良いコードを出してほしい」と。なるほど、確かにそれもロードマップにあって、出力そのものをもっと深く追求する必要があると感じました。
 

[パット・グレイディ](Sequoia Capital)
 ちょっとセンシティブな質問をさせてください。感情的に敏感というわけではなく、少しデリケートな質問です。Notebook LMの開発は、スタートアップのように進んでいる印象があります。チームは小さく、素早く動き、ユーザーのフィードバックをリアルタイムで反映し、不完全なものをリリースしてテストするという姿勢が感じられます。これは、Googleから出るプロダクトに対する一般的なイメージとは違うと思うのですが、GoogleであることがNotebook LMにどのように役立ち、逆にどのように型を破っていると感じますか?


[ソーニャ・ホァン](Sequoia Capital)
 素晴らしい質問ですね。まず、Googleで特に良かったことを2つ挙げます。1つ目は、モデルにアクセスできることです。まだ完全に準備が整っていない段階でも、その能力を見て、将来の可能性を考えながらプロダクトを構築できるのは大きな利点です。「この機能が近々使えるようになるなら、それをどう活かして体験をより良くできるか?」と考えながら進められるのは非常に助かっています。
 2つ目は、人材ですね。本当にスマートで才能ある人たちが集まっていて、みんなクールなものを作りたいという共通の思いがあります。この2つの要素が揃っていることで、プロダクトビルダーとしては「これはすごいことだ!」と感じます。あとは実行に移すだけで、続けていけば何か面白いものをリリースできるという自信があります。
 一方で、型を破る点としては、やはりLabに入ったときから、「とにかく出荷(リリース)することが最優先」と考えていました。特にGoogleのような大きな組織では、何かをリリースするよりも、リリースしない方が簡単な場合が多いです。私は何度も「これがどう影響するか?」と考え込んでしまうことがありましたが、最終的に「最優先は出荷すること。それをあらゆる手段で実現しなければならない」と切り替えました。
 実は、よく偽の締め切りを作っています。「10月10日までに出荷しないといけない!」とメンバーに言うんです。みんな「え? 2週間後の10月10日? どうする?」となって、全員が本気で取り組み始めます。でも実際は、その日までに何も特別なことがあるわけではないんです。それがうまくいっていて、この2年間続いているので、メンバーがこれを聞いていないことを祈ります。


[ジェイソン・シュピールマン](Google)
 また、Googleは「動きが遅い」という印象があるかもしれませんが、私の7年間の経験からすると、実際はかなり速く進むことも多いです。特に大規模なチームは毎日何十億人ものユーザーに影響を与えていますが、私たちのような10人規模のチームだと、そのスピード感と大規模なリソースの両方を活かせる「ちょうど良いポジション」にいると思います。
 

[ソーニャ・ホァン](Sequoia Capital)
 今後もNotebook LMがどんな成長を遂げるのか楽しみにしています。私たちの仕事を奪わないでくれることを願っていますが、ここまで本当に素晴らしいものを作り上げてきたことにおめでとうを伝えたいです。
 

[ライザ・マーティン](Google)
[ジェイソン・シュピールマン](Google)
 ありがとうございました。




2. オリジナル・コンテンツ

 オリジナル・コンテンツは、以下リンクからご視聴になれます。
尚、本投稿の内容は、参考訳です。また、意訳や省略、情報を補足したコンテンツを含んでいます。

Sequoia Capitalより
(Original Published date : 2024/10/15 EST)

[出演]
  Google
    ライザ・マーティン(Pat Grady)
    ジェイソン・シュピールマン(Jason Spielman)

  Sequoia Capital
    ソーニャ・ホァン(Sonya Huang)
    パット・グレイディ(Pat Grady)



<御礼>

 最後までお読み頂きまして誠に有難うございます。
役に立ちましたら、スキ、フォロー頂けると大変喜び、モチベーションにもつながりますので、是非よろしくお願いいたします。 



だうじょん


<免責事項>


 本執筆内容は、執筆者個人の備忘録を情報提供のみを目的として公開するものであり、いかなる金融商品や個別株への投資勧誘や投資手法を推奨するものではありません。また、本執筆によって提供される情報は、個々の読者の方々にとって適切であるとは限らず、またその真実性、完全性、正確性、いかなる特定の目的への適時性について保証されるものではありません。 投資を行う際は、株式への投資は大きなリスクを伴うものであることをご認識の上、読者の皆様ご自身の判断と責任で投資なされるようお願い申し上げます。


いいなと思ったら応援しよう!

この記事が参加している募集