【データ分析】BigQueryでGA4のイベント集計:event_params・user_pseudo_id(基本)
はじめに
仕事で、BigQueryでGA4のイベント集計をする必要が出てきたので、BigQueryの使い方の基本を備忘録として記載。
今回は、ユーザーの新規会員登録(イベント名:signup_complete)の流入経路を分析する例を記載する。
前提:GA4とBigQueryをリンクする
GA4のデータをBigQuery上で分析するには、GCPでBigQueryプロジェクトを作成したのちに、BigQuery Exportの設定を行なっておく必要がある。
GA4の管理セクションに移動し、プロパティ列で「BigQueryのリンク」を選択。
「リンクを作成」をクリックし、データをエクスポートしたいBigQueryプロジェクトを選択する。
データセットのエクスポート頻度(毎日、毎時など)とエクスポートするデータの範囲を設定する。
BigQueryのテーブルとフィールド
テーブル
BigQueryプロジェクトへエクスポートされたデータは、analytics_{プロパティID} という名前のデータセットで保存される。
エクスポートの頻度を毎日に設定している場合、このデータセット内にevents_YYYYMMDD という日付毎のテーブルが毎日作成される。
イベントテーブルのフィールド
いくつものフィールド名があるが、よく使うのは下記4つ。
event_date:イベントが発生した日
event_name:イベント名(gtagなどで設定する)
event_params:イベントに関連する追加情報。この中には「どのページを見たか」や「どの商品を買ったか」といった詳細が含まれる。これは複数の値を持つことができるので、いくつかの異なる情報が入っていることがある(後述)。
user_pseudo_id:ユーザーのユニークな識別子(後述)
event_paramsが、さらに入れ子になっていて、分かりにくいので、詳しく見ていく。
GA4でのイベント設定と、event_name, event_paramsの関係
GA4でイベントを記録する際には、gtag('event', ...) 関数を使う。この関数には主に、イベント名とイベントパラメータの2つのパートがある。
gtagでのGA4イベント記録に関しては下記公式サイトで記載されている。
上記公式サイトに記載されている下記例をもとに考える。
gtag('event', 'screen_view', {
'app_name': 'myAppName',
'screen_name': 'Home'
});
event_name は 'screen_view' (gtagの第二引数)。これはGA4に記録されるイベントの種類を示しており、ユーザーが画面を閲覧したことを表している。
event_params は、イベントに関する追加情報を含むオブジェクト。この例では2つのパラメータがある。
'app_name': アプリケーションの名前を示すパラメータ(key)。この場合、その値(value)は 'myAppName' 。
'screen_name': ユーザーが閲覧している画面の名前を示すパラメータ(key)。この場合、その値は 'Home' (value)。
GA4のBigQueryエクスポートでは、これらのイベントパラメータは event_params フィールドに格納され、それぞれのパラメータは key-value ペアの形式で記録される。event_params フィールドは RECORD 型であり、複数の key-value ペアを含むことができる REPEATED フィールド。
GA4のデータをBigQueryでクエリする場合、event_name に基づいて特定のイベントをフィルタリングし、…
続きは、こちらで記載しています。