BigQueryについて学ぶ〜マーケティング担当の一人言
今日は、BigQueryについて簡単にまとめてみようと思います。当たり前ですがGoogleデータポータルやGoogle Analytics360との互換性が良いので、BigQueryを使いこなすと分析の幅がかなり広がります。
Google Analytics360については以下にまとめてあります。
宜しければご覧ください。
BigQueryとは?
適切なハードウェアとインフラストラクチャを用意せずに大規模なデータセットを保存したり、それに対してクエリを実行したりすると、時間と費用がかかってしまいます。Google BigQuery は、こうした問題を解決するために Google のインフラストラクチャの処理能力を使用して SQL クエリを超高速で実行する、エンタープライズ データ ウェアハウスです。
さすがGoogleですね・・・
参照元:
https://cloud.google.com/bigquery/what-is-bigquery?hl=ja
早速調べていて、BigQueryの費用まわりとか、導入方法について全く理解していないことに気づきました。このあたりは自分で調べながら、詳しい人に質問して理解を深めたいと思います。
困ったときの標準 SQL リファレンス
BigQueryでSQLの構文がわからないときはリファレンスにて、型を確認するとスムーズにデータを出すことができます。
過去作成しているクエリがレガシーSQLで書かれている場合もあるので注意してみてください。基本的に自分で調べる癖を付けたいですね。自戒を込めて・・
BigQuery の標準 SQL は、SQL 2011 標準との互換性を有し、ネストされ繰り返されたデータのクエリをサポートする拡張機能が含まれています。
参照元:
https://cloud.google.com/bigquery/docs/reference/standard-sql/?hl=ja
■標準 SQL の利点
標準 SQL は SQL 2011 標準に準拠し、ネストされ繰り返されたデータのクエリをサポートする拡張機能を備えています。レガシー SQL に勝る次のようないくつかの利点があります。
WITH 句と SQL 関数を使用したコンポーザビリティ
SELECT リストと WHERE 句内のサブクエリ
相関サブクエリ
ARRAY データ型と STRUCT データ型
挿入、更新、削除
COUNT(DISTINCT <expr>) は正確でスケーラブルであり、EXACT_COUNT_DISTINCT の精度をその制限なしで提供
JOIN による自動述語プッシュダウン
任意の表現を含む複雑な JOIN 述語
参照元:
https://cloud.google.com/bigquery/docs/reference/standard-sql/?hl=ja
どの操作にお金がかかるのか
詳しくまとめてあるqiitaをみつけたので貼っておくきます。
高額課金にならないためのポイントが整理されていて読みやすい。
毎回思うけど、こういう専門的な内容をまとめられる人になりたい・・・
BigQueryで課金される内容は
・ストレージ代金
・データ操作代金
どのようなテーブルにするかなどは、マーケティング視点が必要なので
課金に注意しながら、
エンジニアの方と連携して導入を進めていきたいですね。
参照元:
https://qiita.com/kamujun/items/ab3cd3e6f8934a01cbc8
■自社のデータがどのようになっているか聞いてみるメモ
BIGQueryを自社で導入している場合は、このあたりを理解しておくといいかも。
・BIGQueryへのデータ格納方法は?
・Streaming Insert ではなく Load 方式?
・料金プランは?
・費用削減の施策は?
・管理体制と課題は?
まとめ
正しい経営判断をしていくためには、正しい数値管理が重要です。
それを実現するための数値管理の土台であるBigQueryを導入するメリットは大きいと思います。
そして、
BigQueryをスタートアップで導入できる人は本当にすごいです・・・
メルカリにきてデータ取得に困ったことないことを考えると・・
導入した方々を心から尊敬します。
さて、
明日はGoogle Analytics360とBigQueryの連携についてまとめてみたいと思います。
本日もお読みいただきありがとうございます!
毎日一記事書いていますので、
内容がよければ「スキ&フォロー」をいただけたら幸いです。