• Auteur/autrice de la publication :
  • Post category:Blog

Google visual data studio échantillonnage

Echantillonnage sur Google Analytics : Contournez-le grâce à Google Visual Data Studio – Web Analytics

Vous le savez peut-être, ou vous y serez certainement confronté un jour, l’échantillonnage sur Google Analytics peut devenir parfois un vrai problème… notamment lorsque vous souhaitez comparer 2 périodes de données.

L’échantillonnage sur Google Analytics Standard s’applique lorsque « Les requêtes ponctuelles de vos données sont soumises aux seuils standards suivants pour l’échantillonnage : 500 000 sessions au niveau de la propriété pour la plage de dates utilisée et 100 millions de sessions au niveau de la vue pour la plage de dates utilisée pour Analytics 360 ». Pour en savoir plus, direction l’aide Google Analytics.

L’échantillonnage s’applique sur les segments Google Analytics :

La vigilance doit être tout particulièrement de mise sur les segments Google Analytics. En effet, « Analytics standard et Analytics 360 appliquent des segments après le filtrage des rapports et l’échantillonnage. En d’autres termes, un segment peut inclure un nombre de sessions inférieur à celles comprises dans l’échantillon global. »

Donc… l’application d’un segment peut vous amener à raisonner sur des données échantillonnées et de fait… pouvant être imprécises.

Comment savoir si Google Analytics échantillonne ma donnée ?

Tout d’abord, comment savoir si votre analyse se fait sur une donnée échantillonnée ?

Regardez la petite icône en haut !

Dans l’exemple ci-dessous, l’icône est de couleur VERTE, donc la donnée n’est pas échantillonnée :

Echantillonnage Google Analytics - Digital analytics

Dans cet exemple, en revanche, lorsque l’icône devient ORANGE, la donnée est échantillonnée :

Echantillonnage Google Analytics - web analytics

Cas pratiques, avec l’application de segments sur google Analytics et des données qui deviennent… FAUSSEES

Maintenant, regardons quelques cas pratiques… et parfois TRES ETONNANTS… qui peuvent amener à de véritables erreurs d’analyse…

Prenons un exemple d’application d’un segment sur une donnée échantillonnée… et les étonnants, ou plutôt contrariants résultats que cela peut amener.

1er cas de figure : Application d’un segment sur une période donnée, et analyse par canaux d’acquisition

web analytics - échantillon

Donc sur la période en question, l’application d’un segment nous renvoie 4 313 sessions, en menant l’analyse sur les canaux d’acquisition.

2nd cas de figure : Application d’un segment sur une période donnée et analyse par pages de destination. 

Logiquement on devrait avoir le même nombre de sessions que précédemment…

GA segment échantillon

Et bien non ! J’ai ici 4 309 sessions sur l’analyse par pages de destination… au lieu de 4 313… Bon, là j’ai déjà un décalage de 4 sessions. C’est raisonnable, c’est à peine 0,1% de différentiel… mais déjà on peut se tirer les cheveux !

3ème cas de figure : Application d’un segment sur une période donnée et comparaison avec la période précédente.

Et là… c’est le drame… les écarts peuvent devenir très grands… et les erreurs d’analyse peuvent survenir (et non là ce n’est pas par enchantement !). On compare ici la même période au mois précédent (novembre VS octobre) :

Parce que dans l’exemple ci-dessus, si vous regardez bien… le volume de sessions remonté est de… 4 406. Alors que le bon chiffre est de 4 314. ici, on a 92 sessions en plus… soit un décalage de 2%...

En plus ? a priori c’est bien pour les chiffres… oui mais quant il s’agit de comparer, 2% en plus ça peut faire des variations plus grandes… et des chiffres qui trahissent la réalité de la variation.

Allons encore plus loin… le même exemple, mais cette fois-ci on compare la même période à la période précédente (ici ce n’est pas tout à fait le mois, mais bien du 2 octobre au 31 octobre). Et boum… on a encore un autre chiffre !

echantillon_web analytics _ variatioon _ webanalytics

On est ici à 4 416… quand auparavant on a eu 4 406, ou encore 4 314, ou encore 4 309…

Quel impact sur les tableaux de bord (dashboard) de Google Visual Data Studio ?

Autant sur Google Analytics, on peut voir que la donnée est échantillonnée… autant sur les tableaux de bord Visual Data Studio… et bien on ne voit pas que la donnée a subi un échantillonnage.

Surtout… plus grave / déconcertant / abracadabrant / tordu… sur les dashboards Visual data Studio, on s’est retrouvé avec un écart non plus de 6,8% comme dans l’exemple ci-dessus… mais une variation de 13 % !!

Imaginons que vous ne challengiez pas vos données… vous allez vous contenter d’observer un recul de 13 % quant il n’est que de 6 %… Et là ça devient vraiment très problématique…

L’exemple ci-dessous est un simplement une illustration de Google Visual Data Studio.

Google Visual Data studio - Exemple _ Web analytics

De fait… les segments Google Analytics, lorsqu’ils sont soumis à l’échantillonnage de Google Analytics, peuvent devenir de vraies sources d’erreurs sur Visual Data Studio. La donnée n’est pas erronée en soi, elle est échantillonnée et les échantillons varient… de là, des comparatifs qui peuvent induire en erreur.

Comment faire pour contourner les échantillonnages liés aux segments sur Visual Data Studio ?

Cette « astuce » ne s’applique pas à tous les cas de figure, mais elle peut être une solution pertinente pour nombre de cas.

Pour le faire… on va utiliser les FILTRES de Visual data Studio « Filtre / score card filter »

Filtre_visual data studio Web analytics

Dans le cas que nous avons traité, nos segments étaient basés sur certaines typologies de pages de destination.

Grâce aux FILTRES de Visual Data Studio, nous avons pu créer les conditions de cette segmentation via le filtre Visual data Studio.Filtre page de destination Google Visual Data Studio _ Web analytics

Ici, nous avons donc créé un filtre pour isoler certaines pages de destination (en utilisant les règles d’expressions régulières pour filtrer les URLs).

En utilisant les filtres Visual data Studio, plutôt que les segments Google Analytics… les données ne sont plus échantillonnées.

Cette approche nous a permis d’échapper à l’échantillonnage / risque d’échantillonnage de cette donnée.

Evidemment, les filtres ne remplacent pas les segments… du moins ils ne peuvent pas toujours s’y substituer…

Néanmoins, dans certains cas, ça peut être la solution pour ne pas utiliser les segments et éviter l’échantillonnage et les aléas des données échantillonnées.

Stay in touch !

Gabriel

Liens utiles : Google Visual Data Studio, Google Analytics, L’aide Google Analytics

Bee4, votre agence web analytics à Paris et à Lyon.

Vous voulez en savoir plus sur notre expertise d’agence web analytics ?

Bee4 est une agence web analytics, basée à Paris et à Lyon.

 

 

 

 

La publication a un commentaire

  1. Henry Roussel

    Merci pour ces précisions très utiles pour bien se positionner sur les moteurs de recherche.

Les commentaires sont fermés.