【GA4×BigQuery】GA4のBigQuery Exportスキーマの徹底解説!pseudonymous_users_やusers_テーブルも!
テーブル構造
GA4のBigQuery Exportを利用する時に、4種類のテーブルが自動的に蓄積されていきます。
events_:GA4が取得しているすべてのイベントをベースに集計したテーブル。基本メインに使うテーブルはこのテーブルとなります。
events_intraday_:events_と同様でイベントをベースに集計したテーブルですが、当日のみのデータとなります。
また、ストリーミング エクスポート オプションが有効になっている場合のみ、events_intraday_のテーブルが作成されます。pseudonymous_users_:GA4が付与したユーザーID pseudo_user_id をベースに集計したテーブル。
ただし、要注意なのは、pseudo_user_id は仮名化した疑似 IDです。通常、GA側でGoogle シグナルを有効化にすると、ユーザーが 異なるブラウザで同じ Google アカウントにログインしていた場合は、GA4はこれを 1 人のユーザーと認識しますが、BigQuery ExportではGoogle シグナルの情報を利用できないため、ユーザーは異なるブラウザからウェブサイトに訪問すると、異なるユーザーとして記録されます。users_:会員IDやカスタマーIDなど、自社で生成したユーザーID をベースに集計したテーブル。
User-ID 機能を使用すると、自社が生成したIDをGA4のユーザーID pseudo_user_id と紐づけることができ、特にSaasや購買期間の長い商材のLTV分析がより正確的に行うことが可能になります。
後者のpseudonymous_users_ と users_ について重要なことをいくつか補足します:
この2つのテーブルを利用するには、 BigQuery Export のセットアップ時、ユーザーデータの日次エクスポートを選択する必要があります。
pseudonymous_users_ は同意していないユーザーのデータはこの表にエクスポートされない、かつ、user_id はこの上にエクスポートされません。
users_ はユーザーの同意を問わず、user_idが含まれていればテーブルにエクスポートされます。また、 pseudo_user_id はusers_ にエクスポートされることはありません。
テーブルの使い分け
通常の分析では、events_ を使えば十分です。
ただし、クイックにLTV分析をしたい、もしくはGAの予測機能を利用したい時は、後者の2つのテーブルを使うことがおすすめです。
この2つのテーブルのカラムに関する説明は公式ドキュメントに詳しく記載しています、興味ある方はぜひご一読ください。
https://support.google.com/analytics/answer/12769371?hl=ja