
Comment continuer le filtrage des robots sans « fournisseur de services »
[ad_1]
Option 1: API de géolocalisation
Et si je vous disais que vous pourriez ramener la dimension «Prestataire de services» dans son intégralité à votre configuration? Cela semble trop beau pour être vrai, mais c’est possible (avec une petite prise, mais nous y reviendrons dans un instant). Cette notion est réalisable en utilisant une interface de programmation d’application (API) de géolocalisation pour fournir des données similaires au «fournisseur de services». Juste au cas où vous ne seriez pas familier avec cela, une API est essentiellement un ensemble de fonctions qui vous permettent de parler à un serveur pour qu’il vous envoie les données que vous recherchez.
Maintenant, vous vous demandez peut-être comment les API de géolocalisation s’intègrent-elles précisément et comment les utiliser? Bon nombre d’entre eux offrent un point de données particulier qui nous intéresse: l’Internet de l’utilisateur Fournisseur de services (FAI). Et oui, c’est fondamentalement la même chose.
Pour intégrer les données de géolocalisation dans votre configuration Google Analytics:
- Une demande est faite dans le navigateur (pendant que l’utilisateur est sur le site) au fournisseur de données de géolocalisation, qui enverra une réponse, si la demande a abouti.
- Ensuite, les données contenues dans la réponse du fournisseur peuvent être transférées dans la couche de données, pour une utilisation à la fois dans Google Tag Manager et Google Analytics. Simo Ahava a créé une balise personnalisée pour résoudre ce problème, mais des options sont disponibles pour une approche plus pratique.
Une fois que vous avez importé les données FAI dans votre système de gestion des balises à l’aide de variables de couche de données, vous pouvez ensuite configurer les balises Google Analytics pour les utiliser comme dimension personnalisée. Lors de la configuration de la dimension du côté de Google Analytics, je vous recommande de la configurer au niveau de la « session ». De nombreuses API de géolocalisation peuvent même fournir plusieurs points de données en plus du FAI qui peuvent potentiellement être utilisés pour vous aider à mieux comprendre vos rapports.
Mais je dis cela avec un avertissement: assurez-vous de vérifier que les informations que vous importez n’exposent aucune information personnellement identifiable (PII), ou votre compte Google Analytics pourrait être résilié, alors abordez cela avec prudence.
Un autre point à considérer lors de la poursuite de cette option est la quantité de trafic que votre site reçoit quotidiennement. En fonction de ce que vous utilisez, les extractions d’API peuvent être plafonnées avec une limite quotidienne, et chaque appel envoyé à Google Analytics qui extrait des données de géolocalisation ajoute à cette limite. Si votre site reçoit un trafic important et que vous effectuez un tirage de trop, l’API commencera à rejeter les demandes et arrêtera d’envoyer des données de géolocalisation, laissant des lacunes dans vos rapports. Certaines API ont des options d’abonnement payant qui permettent des tirages illimités, mais vous devrez vous pencher sur cela et décider si c’est la bonne solution pour vous.
Option 2: utilisation des dimensions de Google Analytics
L’option la plus populaire des deux, car elle est basée sur des données déjà implémentées dans votre configuration Google Analytics. Cette option se concentre sur un processus en deux étapes:
1. Analyser vos rapports pour trouver des modèles qui sont en corrélation avec le trafic des robots
Pour cette étape, vous voulez parcourir autant de données que possible (avant que l’échantillonnage ne commence) pour vous aider à donner une image décente de la quantité de trafic de robots affectant vos données. Je vous recommande de concentrer votre enquête sur les dimensions et les statistiques trouvées dans les rapports « Audience ». Pour les métriques, les utilisateurs, les sessions et le taux de rebond sont ceux que je regarde en premier. Les robots ont une durée d’attention très courte, ils seront donc généralement actifs sur une seule page, après quoi ils quitteront le site. Pour cette raison, Google Analytics les suivra comme ayant un nombre égal d’utilisateurs, de nouveaux utilisateurs et de sessions, ainsi que des taux de rebond très élevés, ce qui est généralement un cadeau.
Un exemple: dans le passé, en examinant la dimension linguistique, nous sommes tombés sur la valeur unique «c» et considérant que les valeurs linguistiques devraient avoir au moins deux caractères, c’était un indice que le trafic n’était pas légitime. Et voilà, il y avait un nombre égal d’utilisateurs, de nouveaux utilisateurs et de sessions et un taux de rebond alarmant.
Pour vous aider à démarrer votre demande, j’ai trouvé que les dimensions du navigateur et de la langue étaient de bons points de départ pour remarquer le comportement du trafic des robots lors d’enquêtes antérieures. Mais rappelez-vous que le but est de trouver des valeurs uniques qui se synchronisent avec le comportement du trafic des robots, donc si vous ne voyez aucune corrélation avec celles-ci, la recherche d’autres dimensions peut donner de meilleurs résultats.
Vous pouvez également constater que l’ajout de filtres secondaires aux rapports ou la création de rapports personnalisés peuvent aider à fournir un aperçu plus détaillé des dimensions affectées par le trafic des robots. Soyez conscient des problèmes d’échantillonnage si vous faites cela, car ils génèrent des requêtes ad hoc.
2. Concevoir une solution qui se concentre sur vos résultats
Une fois que vous avez reconnu les dimensions et les statistiques biaisées, attribuées au trafic des robots, il est temps de mettre en œuvre des mesures pour les exclure de vos rapports. En particulier, nous allons nous concentrer sur les filtres qui se concentrent sur ces modèles.
Selon la granularité de vos résultats de l’étape précédente, votre approche peut différer. Si vous pouvez attribuer des problèmes détectés à une valeur de dimension particulière, il suffit d’un simple filtre d’exclusion. Mais si vous avez trouvé une section transversale plus spécifique de valeurs provenant de plusieurs dimensions, une combinaison de filtres avancés et d’exclusion est la voie à suivre.
Supposons que vous ayez trouvé des valeurs dans trois dimensions qui présentent des comportements de trafic de bot, vous pouvez combiner les valeurs de deux de ces dimensions dans un champ personnalisé à l’aide d’un filtre avancé. Créez ensuite un autre dans lequel vous connectez la valeur du champ personnalisé à la valeur de la troisième dimension et exportez-la dans une dimension personnalisée. Enfin, implémentez un filtre d’exclusion basé sur la sortie de la dimension personnalisée.
Quelle option vous convient le mieux?
Si vous cherchez essentiellement à ramener la dimension du fournisseur de services et que vous pouvez payer des frais d’abonnement, je pencherais vers la route API de géolocalisation, car cela peut être rapidement configuré pour commencer à envoyer des données.
Bien que vous puissiez trouver des API qui autorisent les demandes gratuitement, il peut y avoir un plafond sur le nombre que vous pouvez le faire, gardez cela à l’esprit pour éviter toute perte de données de géolocalisation. Gardez à l’esprit que vous devrez peut-être également tenir compte du temps de recherche pour créer votre filtre de bot à l’aide de ces données.
Si vous ne souhaitez pas gérer les frais mensuels, vous pouvez directement créer une solution en utilisant vos dimensions déjà établies dans Google Analytics. En règle générale, c’est mon option préférée entre les deux, en particulier avec les filtres avancés, car elle permet un haut degré de spécificité en termes de valeurs que vous utilisez pour le filtre, et leur mise en œuvre m’a beaucoup appris sur les modèles de trafic de bot et comportements. Mais soyez prêt à faire des vérifications régulières sur les fonctionnalités du filtre, car le trafic des robots n’est jamais cohérent.
En fin de compte, il n’y a pas de bien ou de mal ici, quel que soit votre choix, vous aurez un ensemble de données plus riche et filtrerez les bots en un rien de temps. Comme toujours, si vous avez des questions sur ce qui précède, n’hésitez pas à nous contacter au sein de l’équipe Data!
[ad_2]