NotebookLM, Apple Intelligence, Claude 3.5 Sonnet - Generative AI 情報共有会 #18
今週、6月25日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。
この連載の背景や方向性に関しては 第一回の記事 をご覧ください。
Google、NotebookLMを日本語で提供開始(2024/06/06)
Google DriveのファイルやPDF、テキストファイル、WebページのURLなどをアップするとその情報を元に要約やよくある質問、教材を作成したり、文書に対して質問し文書の内容をもとに回答させることができる。
【触ってみた】
5月29日に公開された、デジタル庁の「テキスト生成AI利活用におけるリスクへの対策ガイドブック(α版)」のPDFをアップロードして使ってみる。
まずPDFをアップロード
アップロードが完了すると、「概要」とともに「よくある質問」や「学習ガイド」などの生成や「質問の候補」を提案してくれる。
「よくある質問」の生成例
「学習ガイド」の生成例
「ブリーフィング・ドキュメント」の生成例
「タイムライン」の生成例(今回アップロードしたPDFはタイムラインの生成に適していなかった)
質問をすると、文書中の内容を元に、参照箇所を示しながら回答してくれる。
生成された文章中に①や②などの数字が付記されており、そこにカーソルを合わせると、アップロードされた文書中のどこに記載された内容をもとに回答をしているかが表示される。
生成AIを利用して要約や質問への回答を生成させる場合、記載されていないことを生成するなどのハルシネーションを起こすことに注意する必要があるが、このように回答を生成した根拠となる箇所を示してくれることは真偽確認をする上で非常にありがたい。
また、①や②をクリックすると、左側にPDF中の文書が表示され、回答の根拠とした文章がハイライトされる。
Apple、Apple Intelligenceの発表と内部で利用されているモデルの概要を公開(2024/06/10)
Apple、WWDC2024でiPhoneやMacに搭載予定の “パーソナルインテリジェンスシステム”、Apple Intelligenceを発表。また、内部で利用されているモデルの概要を公開。
Apple Intelligence
Apple製品上で、メール、メモ、Pages、他社製アプリなど、ほぼすべてのライティング場面で、文章の書き直し、校正、要約が可能に。
通知の内容を理解し、重要と思われる通知を優先的に表示。
メッセージで送る画像を生成して送信可能。会話内容から関連する画像のパーソナライズを受けることもできる。
(下画像例では画像内の人物もチャット相手のアイコン画像から生成されている)
メモでのラフなスケッチを綺麗な画像に変換する(動画)。
Siriは画面を認識し、アクションを実行(ex. メッセージ画面を表示した状態で「この住所を連絡先に登録して」というと登録してくれる。動画)
デバイス上の情報を元にアクションを実行(ex. メッセージとEメールどちらに書かれているかを指示しなくとも「フライトの到着時間はいつ?」と聞くと情報を探し出し回答)
Appleデバイス上でChatGPTも利用可能に。
Apple Intelligenceで利用されている生成モデル概要
モデルは以下の2種類
Apple On-Device
Appleデバイス上で動作することを目的とした3Bパラメータまでのモデル
Apple Server
Private Cloud Compute(Appleが開発した、送信されたユーザーの個人データにそのユーザー以外はアクセスできないように設計したクラウド環境)上で動作するApple On-Deviceより大規模なモデル
【性能】
要約における、人間の満足度による評価。同等サイズのモデルPhi-3と比較し、優れた要約生成を実現。
(Phi-3についてはこちらの記事でも紹介しています。)
様々なオープンソースモデルや商用モデルとの人間による出力比較。Apple On-Deviceはよりパラメータ数の大きいMistral-7BやGemma-7Bをも凌駕する性能。
出力の有害性評価(値が低いほど有害性が少なく良い)。Appleのモデルは有害な出力が少ないという評価。
要約や作文能力も高い。
Anthropic、Claude 3.5 Sonnet発表(2024/06/21)
Claude 3.5モデルファミリーの最初のリリースとして、中位モデルClaude 3.5 Sonnetを発表。
Claude 3の中位モデルSonnetの性能を引き上げ、より大きなCluade 3 Opusを低コストで性能を上回るモデルとなる。
様々なベンチマークで、GPT-4oやGemini 1.5 Proを上回る
Claude 3.5 SonnetはClaude.aiとClaude iOSアプリで無料で利用可能。Anthropic API、Amazon Bedrock、Google CloudのVertex AIからも利用可能。
Claude 3.5 HaikuとClaude 3.5 Opusは今年後半にリリース予定。
お知らせ
少しでも弊社にご興味を持っていただけた方は、お気軽にご連絡頂けますと幸いです。まずはカジュアルにお話を、という形でも、副業を検討したいという形でも歓迎しています。(SpeakerDeck資料がアップデートされました。)