GA4 → BigQuery : le pipeline data, pas à pas
De l'export GA4 vers BigQuery jusqu'à un dashboard Looker exploitable.
Brouillon — relu et complété par Yoann avant publication.
GA4 dans l’interface, c’est bien pour explorer. Mais dès que tu veux croiser des sources, garder l’historique au-delà des limites de rétention, ou répondre à des questions business précises, tu as besoin de la donnée brute. C’est là qu’intervient l’export BigQuery — gratuit, natif, et puissant.
1. Activer l’export
Dans GA4 → Admin → BigQuery Links. Tu choisis un projet GCP, la fréquence (daily, et streaming si besoin), et les events à exporter. Dès le lendemain, tes données arrivent dans un dataset analytics_XXXXXX.
2. Comprendre le schéma des events
Chaque ligne = un event, avec une structure imbriquée :
event_name,event_timestampevent_params(tableau clé/valeur)user_pseudo_id,user_iddevice,geo,traffic_source…
La principale difficulté, c’est le unnesting des event_params. Une fois ce réflexe acquis, tout devient accessible.
3. Quelques requêtes utiles
- Sessions et utilisateurs par jour
- Funnel de conversion event par event
- Attribution first/last touch à partir de
traffic_source - Revenu par canal en croisant avec les données e-commerce
4. La modélisation
Plutôt que de réécrire les mêmes UNNEST partout, on construit des tables intermédiaires propres (sessions, utilisateurs, commandes) — idéalement versionnées et documentées. C’est ce qui transforme un dataset brut en socle analytique fiable et réutilisable.
5. Brancher Looker Studio
Looker Studio se connecte directement à BigQuery. La bonne pratique : pointer Looker sur tes tables modélisées (pas sur l’export brut), pour des dashboards rapides et des coûts maîtrisés.
6. Coûts & bonnes pratiques
- Partitionner par date et clusteriser les grandes tables.
- Éviter le
SELECT *sur l’export brut. - Matérialiser les agrégats lourds plutôt que de les recalculer à chaque ouverture du dashboard.
- Surveiller le volume scanné (la facturation BigQuery est au volume lu).
Au bout du pipeline : des events bruts transformés en décisions — avec l’historique complet, les croisements que l’interface GA4 ne permet pas, et des coûts qui restent négligeables pour la plupart des sites.