見出し画像

BigQueryについて学ぶ〜マーケティング担当の一人言

今日は、BigQueryについて簡単にまとめてみようと思います。当たり前ですがGoogleデータポータルやGoogle Analytics360との互換性が良いので、BigQueryを使いこなすと分析の幅がかなり広がります。

Google Analytics360については以下にまとめてあります。
宜しければご覧ください。

BigQueryとは?

適切なハードウェアとインフラストラクチャを用意せずに大規模なデータセットを保存したり、それに対してクエリを実行したりすると、時間と費用がかかってしまいます。Google BigQuery は、こうした問題を解決するために Google のインフラストラクチャの処理能力を使用して SQL クエリを超高速で実行する、エンタープライズ データ ウェアハウスです。

さすがGoogleですね・・・

参照元:
https://cloud.google.com/bigquery/what-is-bigquery?hl=ja

早速調べていて、BigQueryの費用まわりとか、導入方法について全く理解していないことに気づきました。このあたりは自分で調べながら、詳しい人に質問して理解を深めたいと思います。

困ったときの標準 SQL リファレンス

BigQueryでSQLの構文がわからないときはリファレンスにて、型を確認するとスムーズにデータを出すことができます。
過去作成しているクエリがレガシーSQLで書かれている場合もあるので注意してみてください。基本的に自分で調べる癖を付けたいですね。自戒を込めて・・

BigQuery の標準 SQL は、SQL 2011 標準との互換性を有し、ネストされ繰り返されたデータのクエリをサポートする拡張機能が含まれています。
参照元:
https://cloud.google.com/bigquery/docs/reference/standard-sql/?hl=ja
■標準 SQL の利点
標準 SQL は SQL 2011 標準に準拠し、ネストされ繰り返されたデータのクエリをサポートする拡張機能を備えています。レガシー SQL に勝る次のようないくつかの利点があります。

WITH 句と SQL 関数を使用したコンポーザビリティ
SELECT リストと WHERE 句内のサブクエリ

相関サブクエリ
ARRAY データ型と STRUCT データ型
挿入、更新、削除
COUNT(DISTINCT <expr>) は正確でスケーラブルであり、EXACT_COUNT_DISTINCT の精度をその制限なしで提供
JOIN による自動述語プッシュダウン
任意の表現を含む複雑な JOIN 述語

参照元:
https://cloud.google.com/bigquery/docs/reference/standard-sql/?hl=ja

どの操作にお金がかかるのか

詳しくまとめてあるqiitaをみつけたので貼っておくきます。
高額課金にならないためのポイントが整理されていて読みやすい。
毎回思うけど、こういう専門的な内容をまとめられる人になりたい・・・

BigQueryで課金される内容は
・ストレージ代金
・データ操作代金

どのようなテーブルにするかなどは、マーケティング視点が必要なので
課金に注意しながら、
エンジニアの方と連携して導入を進めていきたいですね。

参照元:
https://qiita.com/kamujun/items/ab3cd3e6f8934a01cbc8
■自社のデータがどのようになっているか聞いてみるメモ
BIGQueryを自社で導入している場合は、このあたりを理解しておくといいかも。

・BIGQueryへのデータ格納方法は?
・Streaming Insert ではなく Load 方式?
・料金プランは?
・費用削減の施策は?
・管理体制と課題は?

まとめ

正しい経営判断をしていくためには、正しい数値管理が重要です。
それを実現するための数値管理の土台であるBigQueryを導入するメリットは大きいと思います。

そして、
BigQueryをスタートアップで導入できる人は本当にすごいです・・・

メルカリにきてデータ取得に困ったことないことを考えると・・
導入した方々を心から尊敬します。

さて、
明日はGoogle Analytics360とBigQueryの連携についてまとめてみたいと思います。

本日もお読みいただきありがとうございます!
毎日一記事書いていますので、
内容がよければ「スキ&フォロー」をいただけたら幸いです

いいなと思ったら応援しよう!