GoogleのNotebookLMがドキュメントをポッドキャスト化する新機能を提供 #NotebookLM #Podcast
Googleの新しいAIツール「NotebookLM」が盛大な話題を呼んでいます。このツールはGoogleの最新アイテムモデル「Gemini 1.5」を搭載したノートテイキング及びリサーチツールで、文書の組織化やアイデアの整理を行うための機能を提供しています。中でも、特に話題になっているのが「オーディオオーバービュー」と呼ばれる機能で、これにより文書の内容をAIがまるでポッドキャストのように形式化して予約や内容を説明することが可能になります。
NotebookLMのインノベーティブな機能について
NotebookLMは、ただのノートテイキングツールに留まらず、自分のアイデアを気軽に形式化してまとめることが可能です。ユーザーは文書をアップロードしたり、ウェブリンクを追加したりして、コンテンツの改善を行うことが可能です。しかし、最も話題になっているのは、AIホストが主催する「オーディオオーバービュー」です。この機能を使うと、AIが文書の内容を情報として書き起こし、人間らしい平易な話語の形式で説明することができます。
AIポッドキャストが文書を新しい形式に変える
上記の「オーディオオーバービュー」機能により、たとえば難解で詰まりのある経済報告書なども、まるで人間の談話のように面白く説明することが可能になります。実際に、近日のデモでは、アメリカ連邦済政理事会の「経済見通し」をNotebookLMにアップロードし、その内容をAIホストが事実を分かりやすく説明する様子が展開されました。
例えば、経済成長率2%についての話では、「2%というと、大きな成長には見えないが、この数字は経済にとって安定的な成長を意味する」というように、平易で面白い表現で解説されます。これにより、経済報告書や記録を非常に理解しやすくすることが可能になります。
カスタマイズ可能な予約・調整
また、新たに発表されたカスタマイズ機能により、ユーザーは予約を簡単に調整できるようになりました。これにより、特定のテーマや目的に対して話を書き起こしたり、その内容を調整したりすることが可能です。たとえば、文書を主に読み込む人たちに対してもっと解りやすい説明をするように準備することができます。
GoogleラボのVP、ジョシュ・ウッドワード氏は「カスタマイズ機能は、まるでAIホストに予約前にメモを渡すようなもの」と語っており、これによりよりユーザーの求める内容を調整して書き起こしてくれるのです。
Gemini 1.5の良さと有用性
NotebookLMのベースとなるGemini 1.5は複数のモーダルを理解する力に強みを持っています。これは、文書のような複雑な情報を、書き起こしやオーディオなど、別の形式に変えるというものです。これにより、文書の内容を再構築し、更に解りやすく興味活発に会話形式に編集することが可能になります。これには、人間らしい話語の間々の不安調を添えることで、人間的な話し方や関係性を感じさせるようにしています。
例えば「うーん」や「はい」などの不安調を追加したり、相手の話を取り上げていくようなやり取りを付加しています。これにより、相手との関係を実感しながら不安調も交えた書き起こしになります。
NotebookLMは、ドキュメントを50項目、合計二十五万語以上の内容を処理することが可能で、それは「ハリー・ポッター」のシリーズ一冊の記録量に匹敵するほどの量になります。これにより、総合的な内容を正確に処理し、理解しやすい形式に変えることが可能です。
NotebookLMの未来の希望
現時点では、音声に加えて映像も組み合わせた「Vodcast」の生成にはまだ課題があるとされていますが、大手企業が音声AIに注力している中、これからの進化が期待されます。GoogleやOpenAI、Metaなど、調整の続く各企業が発揮する新技術により、今後の発展に目が集まります。
現在はまだ「仕事の安全」を保っている感じですが、このような新しいAI技術の進化が、将来の仕事の形式を大きく変える日もそれほど遠くないのかもしれまません。