Google Analytics4 では新しくユーザーデータを BigQuery Export で連携することが可能になりました。
この記事では、どのようなデータが新規で連携され、どのようなことができるようになったのかについて紹介します。
ユーザーデータを BigQuery Export に追加する方法は、[GA4] BigQuery Export のユーザーデータ スキーマを参照ください。
概要
ユーザーデータでは、ユーザー軸で集計したテーブルになり、集計軸が異なる以下の 2 つのテーブルが生成されます。
pseudonymous_users_yyyymmdd
: pseudo_user_id
ベースに集計したテーブル
users_yyyymmdd
: user_id
ベースに集計したテーブル
pseudo_user_id
とは擬似 ID と呼ばれますが、ブラウザごとに固有の ID が割り振られます。そのため、別ブラウザを開いたときやシークレットモードを開いた時に値は変わります。
user_id
とは、自社サイト内の DB に保存されている user_id を入れるのが一般的です。
user_id
を入れるためには設定が必要です。設定方法の詳細はユーザー ID を送信するを参照ください。
上記から、2 つのテーブルは集計軸となる ID が異なるだけで集計する指標はすべて同じになるため、user_id が取れている場合はusers_yyyymmdd
を使用し、user_id が取れていない場合はpseudonymous_users_yyyymmdd
を使用するという使い分けになるでしょう。
データの内容
テーブルの全スキーマについては[GA4] BigQuery Export のユーザーデータ スキーマを参照いただき、
ここでは一部指標をピックアップして紹介します。
- user_info: ユーザーの期間的な情報
- last_active_timestamp_micros: 前回のアクティビティ時間 → 頻度を見れる
- user_first_touch_timestamp_micros: first_visit イベントの時刻が残る → ユーザーの継続期間が見れる
- user_ltv: 全期間で集計した指標 → ユーザー軸の分析が簡単になる
- sessions: 合計セッション数
- engagement_time_millis: 合計エンゲージメント時間
- engaged_sessions: 合計エンゲージメントセッション数
- predictions: 予測情報 → 簡単にユーザーの動向を予測することができる
- in_app_purchase_score_7d: 過去 28 日間に操作を行ったユーザーが、今後 7 日間に特定イベント(
in_app_purchase
)を達成する可能性
- churn_score_7d: 過去 7 日以内に操作を行ったユーザーが、今後 7 日間に操作を行わない可能性
ユーザーデータが連携により、ユーザー軸での分析が容易になり、さらにはユーザーの行動を GA4 側で予測した数値を見ることができるようになりました。
テーブルの更新について
Export されるデータは、変更があった全てのuser_id
もしくはpseudo_user_id
のレコードを含みます。
つまり、テーブル名に入っている日にアクセスしたユーザーごとの指標を更新されたレコードが Export されることになります。
このことから、期間内のユーザーの指標を抽出する場合には以下のようなクエリを書くことになります。(以下の例ではユーザーごとの最終更新日を算出)
参考

備考
Hakky ではエンジニアを募集中です!まずは話してみたいなどでも構いませんので、ぜひお気軽に採用ページからお問い合わせくださいませ。
