dbts2023セッションレポート#3 C8「BigQuery と 大規模言語モデル PaLM で進化するデータ分析」
こんにちは。株式会社インサイトテクノロジー マーケティング本部です。
インサイトテクノロジー社員がdb tech showcase2023のセッションを受講した感想レポートの第3弾をお届けします。
db tech showcaseについてはこちらの記事をご覧ください。
報告者
株式会社インサイトテクノロジー
プロダクト開発本部
上原
セッション情報
セッションID:C8
タイトル:BigQuery と 大規模言語モデル PaLM で進化するデータ分析
登壇者:グーグル・クラウド・ジャパン合同会社
カスタマーエンジニアリング
データアナリティクススペシャリスト
村上 祐磨 氏
セッション概要
BigQuery ML(BQML)
BigQueryはBigQuery ML(BQML)という組み込みの機械学習機能を提供しています。BQMLが提供を開始したのは実に5年前(!)。「MLの民主化」を掲げ、誰もがMLの恩恵を気軽に得られることを目指しているそうです。回帰、分類、クラスタリングといったタスクを解くための基本的なモデルはもちろん用意されています。そしてセッションタイトルの通り、BigQueryからGoogleが開発した大規模言語モデルPaLMを呼び出すことができます!
Vertex APIを通じて、SQLでLLMを呼び出せる。https://cloud.google.com/blog/ja/products/data-analytics/integrating-vertex-ai-foundation-models-in-bigqueryより引用
Vertex AIのAPIを叩くことで、PaLMはSQLを使って呼び出されます。これだけ書くのは面倒そうですが、こうしたSQLもPaLMで生成できるとのこと。LLMすごいな~
BQMLの活用事例
非構造化データの分析
BigQueryは画像や動画といった非構造化データを保持することができるので、BQMLを活用することで、その分析ができます!
今回の例では、BigQueryからAPIを通じて、Imagenと呼ばれるImage-to-Textツールを呼び出し、SQLを使って画像質問応答タスクを解いていました。
いかにも機械学習らしいタスクなのに、SQLを叩くだけで最後までできるのはとても魅力的!タスクの予測結果はそのままBigQueryに落ちるので、後のさらなる集計・分析ステップにも活用しやすそうです。
Retrieval-Augmented Generation(RAG)
RAGはLLMが外部のドキュメントを参照できるようにする仕組みですが、こちらもなんとBQMLで完結できます!
BigQueryはベクトルストアやベクトルの類似検索、さらにエンベディングといったRAGに必要な要素をサポートしています。あとはPaLMを呼び出し、適切にプロンプトに埋め込むことでRAGが実現されます。これが全部BigQueryで動くのは興味深いです!
聴講した感想
そのほか、PaLMにSQLクエリのリファクタリングをさせたり、「秘伝のたれ的なSQL」の意味を聞いてみたりなど、データベースエンジニアにとっても耳よりな活用方法のご紹介がありました。
BigQuery, PaLMともに様々なアップデートが予定されているとのことで、今後がとても楽しみですね!
db tech showcaseについて
db tech showcaseは、データに関わるすべての技術者に「学び」「気づき」「変化」を提供する、国内最大規模のデータ技術カンファレンスです。
国内外の有名テック企業が一堂に会し、国内外の革新的な技術や最新の事例などの多数のセッションを提供しています。
12年目となった2023年は12/6~12/8の3日間、ベルサール六本木グランドコンファレンスセンターにて開催され、データに関わるたくさんの方にご来場いただき大盛況のうちに閉幕しました。
2024年は7月に開催予定ですので、ぜひお見逃しなく!
https://www.db-tech-showcase.com/
アーカイブ配信のご案内
db tech showcaseは、期間限定でアーカイブ動画を配信中です。
このレポートでご紹介したC8セッションをはじめとする約100セッションをオンラインでご視聴いただけるほか、講演資料のダウンロードも可能です。
※一部をのぞく
ご視聴には会員登録(無料)が必要となります。
皆さまのご登録・ご視聴をお待ちしております!
https://www.db-tech-showcase.com/2023/