6月6日より、日本語でもGoogleのNotebookLMを使用できるようになりました。
NotebookLMは、最新LLMのGemini 1.5 Proを採用し、ユーザーがアップロードしたファイルの内容を要約したり、文章を加工したり、ファイルに基づいた回答を返したりすることができるAIサービスです。
今回、実際にNotebookLMを使用して、その性能をテストしてみました。
1.NotebookLMの使い方
最初に、以下のバナーをクリックして、NotebookLMのサイトにアクセスします。
すると、以下のページが表示されるので、「Try NotebookLM」ボタンをクリックして、自分のGoogleアカウントにログインします。
すると、以下のページが表示されるので、「新しいノートブック」をクリックします。
次にNotebookLMにアップロードするソースを選択します。ソースは「Googleドライブのファイル」、「ローカルに保存しているPDFファイルやテキストファイル」、「コピーされたテキスト」、「ウェブサイト」から選択できます。
ここでPDFファイルをアップロードすると、以下のようにアップロードしたファイルの概要(文章の要約)が自動的に表示されます。また、画面の右側にはSuggested questions(お勧めの質問)も表示されます。さらに、上部には、5種類のメモを生成するボタンが表示されています。
2.論文の解説
最初に、arXivの英語論文PDFの解説にどの程度使えるか試してみます。
(1) 使用した論文
今回使用したのは、最近、Googleが発表した「Open-Endedness is Essential for Artificial Superhuman Intelligence(人口超知能にはオープンエンドが不可欠)」という論文です。
掲載ページ:https://arxiv.org/abs/2406.04268
PDF:https://arxiv.org/pdf/2406.04268
最初に、比較のためにChatGPT(GPT-4oモデル)に論文PDFファイルをアップロードして要約させました。以下がChatGPTの回答です。
GPT-4oモデルになってからPDFファイルの読み取り性能も向上し、要約もよくまとまっています。
(2) 概要
NotebookLMにこの論文PDFをアップロードしたときに、自動的に表示された概要(論文の要約)は以下のとおりです。
ChatGPTより短いですが、比較的よくまとまっています。
(3) メモの生成
アップロードしたファイルから以下の5種類の形式のメモを生成することができます。
FAQ(よくある質問)
Study Guide(学習ガイド)
Table of Contents(目次)
Timeline(進行表)
Briefing Doc(概要説明資料)
① FAQ(よくある質問)
全体的によくまとまっており、論文の大まかな内容を理解するには、これだけで十分かも知れません。
② Study Guide(学習ガイド)
短い回答形式の質問とその回答や用語集は、要約を補足する詳しい資料となっています。エッセイ形式の質問には回答が付いていないため、改めてこの内容で質問する必要があります。
③ Table of Contents(目次)
目次だけでなく、文章の構成に合せて内容をまとめてくれます。論文の概要を把握するには、これだけで十分です。
④ Timeline(進行表)
Timelineは、物語などの時系列や登場人物を表わすものであり、論文のような説明的文章には向いていません。
⑤ Briefing Doc(概要説明資料)
この資料もよくまとまっており、論文の概要を把握するにはこれだけで十分です。ただし、①から⑤まで見た中では、③のTable of Contents(目次)の方が分かりやすかったように思います。
全体として、論文の概要を把握するには、③のTable of Contents(目次)又は⑤のBriefing Doc(概要説明資料)が適しているようです。
(4) 論文の内容に関する質問
① Suggested questions(お勧めの質問)
入力欄の右側の「*ノートブックガイド」をクリックすると、以下のようなページが表示され、入力欄の左側の「View Chat」をクリックすると、チャット画面に移ります。
ノートブックガイドの右側に「Suggested questions」(お勧めの質問)として、3種類の質問例が表示されます。
上の図では、以下のような質問例が表示されています。
人間の観察者にとって、どのようなシステムがオープンエンドとみなされるのか?
オープンエンドシステムの潜在的な利点と欠点は何ですか?
オープンエンドAIシステムに関連する安全上の懸念は何ですか?
質問例が表示されているところをクリックすると、これらの質問の回答を得ることができます。
回答の中に出てきた「仕様ゲーム」という言葉について聞いてみたのですが、論文の中で説明していないようで、意味は分かりませんでした。このような場合は、論文に書かれていない知識からも回答することができるChatGPTなどの方が優れているようです。ちなみにChatGPTの回答は以下の通りです。
Table of Contents(目次)で論文の概要を把握した後で、このような質問に対する回答を見れば、論文の内容を大まかに理解するには十分と感じます。
さらに、入力欄に自由に質問を入力して、理解を深めることができます。
(5) 論文の内容からブログ記事を執筆
NotebookLMを利用して、論文の内容をテーマにしたブログ記事を書けるかどうか試してみます。
① ブログ記事の作成
よくまとまっていますが、ブログ記事としては短く、さらに内容を膨らませる必要がありそうです。
② 章構成を指定したブログ記事の作成
3章9節構成と指定したことにより、少し内容が充実し、ブログ記事らしくなったように感じます。章や節の数は、論文の長さや内容に合わせて調整してください。
③ ゆっくり解説風の記事の作成
次に、魔理沙と霊夢の「ゆっくり解説」風にまとめてもらいます。
結構できますね。
(6) まとめ
論文などのまとまった文章の概要を把握するために、NotebookLMは非常に使えると思います。
最初に、Table of Contents(目次)又はBriefing Doc(概要説明資料)を作成して論文の概要を把握し、次に、 Suggested questions(お勧めの質問)なども活用して質問で理解を深めるのがお勧めの使い方です。
また、NotebookLMを利用して、論文の内容をテーマにしたブログ記事を作成することも可能です。
3.2種類の異なる資料をまとめる
最近、AnthropicとOpenAIから別々にLLMの内部構造に関する研究成果が発表されました。NotebookLMを使って、これら2種類の研究の共通点や関係性をまとめることができるか試してみました。
(1) 使用した資料
① Anthropicの研究
https://www.anthropic.com/research/mapping-mind-language-model
論文:https://transformer-circuits.pub/2024/scaling-monosemanticity/index.html
② OpenAIの研究
https://openai.com/index/extracting-concepts-from-gpt-4/
論文:sparse-autoencoders.pdf (openai.com)
(2) 2種類の研究の概要
① Anthropicの研究
【論文】Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet
② OpenAIの研究
【論文】Scaling and evaluating sparse autoencoders
(3) 2種類の研究を合わせた概要説明資料
上記4つの資料を基にして、NotebookLMにBriefing Doc(概要説明資料)を作成してもらいました。
一つの資料として、よくまとまっているように見えますが、Anthropicの研究とOpenAIの研究の関係性は、あまり明確ではありません。
(4) 2種類の研究の関係性に対する質問
2種類の研究の関係について尋ねてみました。
AnthropicもOpenAIもLLMの内部構造を探るために、スパースオートエンコーダーという技術を使用していますが、上の回答では、Anthropicが異なる技術を使用しているように読み取れます。
(5) ブログ記事の作成
ここまで取り上げてきた2種類の研究について、ブログ記事を作成してもらいました。
AnthropicとOpenAIが共に利用しているスパースオートエンコーダー(SAE)技術に焦点を当てて書かれており、よくまとまっていると思います。
(6) まとめ
ソースに書かれていない知識をあまり活用できないというNotebookLMの制約上、関係性の明らかでない資料をまとめるのは難しいのではないかと考えていましたが、その割には、かなり上手く、卒なく文章をまとめることができているように思います。
4.特定の情報を基にしたチャットボット
(1) 葬送のフリーレンに関するチャットボット
「葬送のフリーレン」に関する資料をアップロードして、葬送のフリーレンについての質問に答えるチャットボットを作成します。
今回使用した資料は以下の3つのWebサイトです。
最初にQ&A(よくある質問)を作成しました。
次に色々な質問をしてみます。
いくつか間違いがありますが、概ね正しく答えています。
NotebookLMは、ソースを参照して回答を提供する仕組みであり、ユーザーの要望に合わせた創造的な回答(特定のキャラクターを想定した回答など)を作成することはできません。キャラクター設定には不向きなようです。
(2) 確定申告チャットボット
確定申告に関する資料をアップロードして、確定申告についての質問に答えるチャットボットを作成します。
最初に確定申告の手続きに関する資料を以下のサイトから集めます。
今回使用した資料は以下の3つです。
これらの資料をNotebookLMにアップロードして質問してみます。
【参考】ChatGPTの回答
このような場合は、ChatGPTの回答の方が役に立ちます。
NotebookLMは、ソースを参照して回答を提供する仕組みであり、具体的なケースを想定した質問には回答できません。
一般に情報の正確さと回答の柔軟性はトレードオフの関係になるので、バランスをどう取るのかが難しいところです。NotebookLMは情報の正確さを重視するために、回答の柔軟性をある程度犠牲にしており、ソースに含まれていない情報については回答を拒否します。
5.まとめ
NotebookLMは、ソースを参照して回答を提供する仕組みであり、ChatGPTなどの汎用的なチャットボットよりも正確な情報を提供できるという強みがありますが、ソース以外の知識をあまり活用できないため、創造的な回答や具体的なケースを想定した回答を提供することは基本的にできません。
論文などのまとまった文章の概要を把握したい場合には、NotebookLMは非常に有効です。その場合は、最初に、Table of Contents(目次)又はBriefing Doc(概要説明資料)を作成して文章の概要を把握し、次に、 Suggested questions(お勧めの質問)などを活用して質問で理解を深めるのがお勧めの使い方です。
また、NotebookLMを利用して、論文の内容をテーマにしたブログ記事を作成することも可能です。複数のソースを組み合わせて、ブログ記事などの一つの文章にまとめることもできます。
特定の情報を基にしたチャットボットを簡単に作成することができます。ソースを参照しているので、汎用的なチャットボットよりも正確な情報を提供することができますが、具体的なケースを想定した回答は難しいようです。