Personne n’aime le spam, et cela peut être très frustrant pour les propriétaires de sites WordPress car cela implique généralement de prendre le temps d’installer des filtres et de rechercher la meilleure façon de le bloquer. Beaucoup d’entre eux ont maintenant l’habitude de faire face au spam de référencement, car c’est quelque chose qui nous afflige depuis des années. Toutefois, au cours des deux derniers mois, une nouvelle approche a été adoptée à cet égard, sous la forme de ce que tout le monde appelle aujourd’hui le spam linguistique. La plupart d’entre vous ont probablement commencé à le remarquer au moment des élections américaines de 2016. Suivez notre tutoriel ci-dessous sur les meilleurs moyens de bloquer le spam linguistique et de l’empêcher de fausser vos statistiques de trafic et d’analyse. Il est très important de les réparer dès qu’ils commencent à apparaître.

Qu’est-ce que le spam linguistique ?

Alors que le spam de référencement concerne principalement le ciblage des moteurs de recherche, le spam linguistique est généralement utilisé par un spammeur pour un certain agenda ou pour promouvoir ses propres sites ou produits. Ce qui se passe, c’est qu’ils manipulent le langage utilisé par des sites réels comme motherboard.vice.com, thenextweb.com, lifehacker.com, reddit.com, etc. Les spams linguistiques n’enregistrent généralement que les pages vues sur la page d’accueil de votre site WordPress.

Qu’ont-ils à gagner ? Peter Velchev de Dowser l’explique bien :

L’idée derrière cela est qu’une fois que vous voyez l’URL du nouveau visiteur, vous pourriez être tenté de remonter jusqu’à sa source. Cela générerait à son tour de véritables visites sur le site Web du pirate, le poussant ainsi en haut de l’échelle d’évaluation….

Source de référence de spam linguistique
Source de référence de spam linguistique

Les spams linguistiques peuvent être vus dans Google Analytics sur votre tableau de bord ou dans la section « Audience > Géo > Langue ». Voici quelques exemples d’attaques de spam récentes que vous avez pu voir apparaître récemment dans vos rapports :

  • Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!
  • Congratulations to Trump and all Americans
  • Vitaly rules google ☆*:。゜゚·*ヽ(^ᴗ^)ノ*·゜゚。:*☆ ¯\_(ツ)_/¯(ಠ益ಠ)(ಥ‿ಥ)(ʘ‿ʘ)ლ(ಠ_ಠლ)( ͡° ͜ʖ ͡°)ヽ(゚Д゚)ノʕ•̫͡•ʔᶘ ᵒᴥᵒᶅ(=^ ^=)oO
  • o-o-8-o-o.com search shell is much better than google!
  • o-o-8-o-o.com search shell is much better than google!

Google travaille apparemment à résoudre ce problème, mais ils sont de plus en plus à émerger. Une fois que l’un s’arrête, un autre semble commencer.

Spam linguistique Google Analytics
Spam linguistique Google Analytics

Ceci est une capture d’écran prise sur un tout nouveau site WordPress, et comme vous pouvez le voir, entre le 1er novembre et le 17 décembre, 929 des 1 377 sessions étaient dues au spam linguistique ! Vous parlez d’une distorsion de vos données.

Trafic de spam linguistique
Trafic de spam linguistique

Le problème du spam linguistique a été évoqué sur la table ronde des moteurs de recherche le 9 novembre. Et si nous jetons un coup d’œil à Google Trends nous pouvons voir qu’à partir de Novembre 2016 l’activité autour de « google analytics spam » a grimpé en flèche.

Tendances du spam Google Analytics
Tendances du spam Google Analytics

Pourquoi devriez-vous bloquer le spam linguistique ?

La première raison de bloquer le spam linguistique est pour qu’il ne fausse pas complètement vos données analytiques comme nous l’avons vu plus haut. Si vous souhaitez utiliser les données linguistiques de vos visiteurs, par exemple dans une configuration WordPress multilingue, alors vous voulez que les données soient exactes.

Une autre raison importante, que beaucoup de gens ne réalisent pas, est que les filtres Google Analytics ne s’appliquent pas rétroactivement. Cela signifie que les filtres ne s’appliqueront qu’aux données recueillies à partir du jour où les filtres sont créés. C’est pourquoi il est important de s’attaquer immédiatement au problème du spam. Les données historiques ne peuvent pas être corrigées avec des filtres. Cependant, l’inconvénient de ceci est que si vous implémentez un mauvais filtre, vous pourriez perdre pour toujours des données précieuses. Il y a des segments avancés qui peuvent vous aider avec vos données historiques, dont nous parlerons plus en détail ci-dessous.

Comment bloquer le spam linguistique dans Google Analytics

Il y a quelques options quand il s’agit de s’attaquer au spam linguistique dans Google Analytics. Nous ne recommandons pas nécessairement d’utiliser une extension WordPress, car il est généralement préférable de le faire plus près de la source du problème. De plus, les extensions ont du mal à éliminer les références fantômes. Google Analytics est en fait très puissant lorsqu’il s’agit de manipuler, filtrer et segmenter les données. Et en n’utilisant pas d’extension, vous pouvez vous assurer que quoi qu’il arrive à l’installation de votre site, les filtres/segments resteront en place.

Option 1 : Bloquer le spam linguistique à l’aide d’un filtre

La première et probablement l’une des façons les plus simples de bloquer le spam linguistique dans Google Analytics est d’utiliser un filtre. Les filtres vous permettent de modifier et de limiter les données. Par exemple, vous pouvez exclure certains sous-répertoires, mettre en liste blanches certaines IP ou plages d’IP, etc. Nous vous recommandons de configurer une nouvelle vue chaque fois que vous créez des filtres, car si quelque chose ne va pas, vous devriez toujours avoir accès à vos données originales intactes. Vous appliquez ensuite tous vos filtres personnalisés à la nouvelle vue.

Étape 1 (facultatif)

La première étape consiste à copier votre vue actuelle afin que vous puissiez filtrer les données uniquement dans une vue séparée. Ceci est facultatif pour votre sécurité. Vous avez peut-être déjà une vue séparée, auquel cas vous pouvez passer à l’étape 2. Sinon, cliquez dans la section Admin de Google Analytics et dans vos « Réglages de vue ». Cliquez ensuite sur « Copier la vue ». La raison pour laquelle vous voulez utiliser la copie est que cela va reprendre tous les autres filtres et objectifs que vous avez déjà en place sur votre site WordPress.

Copier la vue dans Google Analytics
Copier la vue dans Google Analytics

Nommez votre nouvelle vue. Dans notre exemple, nous avons choisi « filtered domain.com ». Cliquez ensuite sur « Copier la vue ».

Copier la vue
Copier la vue

Étape 2

Cliquez dans votre nouvelle vue filtrée (ou vue originale) et cliquez sur « Filtres ». Cliquez ensuite sur « + Ajouter un filtre ».

Vous aurez besoin d’un accès « Modification » au niveau « Compte » dans Google Analytics afin de mettre en place de nouveaux filtres, ou vous n’aurez pas la possibilité de suivre ces prochaines étapes.
Ajouter un nouveau filtre dans Google Analytics
Ajouter un nouveau filtre dans Google Analytics

Étape 3

Donnez un nom à votre filtre (ex : Filtre de spam linguisitique). Ensuite, choisissez personnalisé parmi les types de filtres. Vous voudrez sélectionner le filtre « Réglages de langue » et saisissez ce qui suit dans le champ Filter Pattern :

.{15,}|\s[^\s]*\s|\.|,|\!|\/
Filtre de spam linguistique
Filtre de spam linguistique

Vous pouvez ensuite cliquer sur le bouton « vérifier » pour voir un exemple de ce que le filtre a trouvé au cours des 7 derniers jours. Cliquez ensuite sur « Enregistrer » pour appliquer le filtre.

Vérifier le filtre de spam linguistique
Vérifier le filtre de spam linguistique

Et c’est tout ! Vous ne verrez maintenant passer que les langues valides/réelles dans votre Google Analytics.

Option 2 : Bloquer le spam linguistique avec un segment avancé

La deuxième option dont vous disposez pour lutter contre le spam linguistique dans Google Analytics est d’utiliser un segment avancé. Ceux-ci fonctionnent en fait avec vos données historiques et sont généralement considérés comme une option plus sûre pour modifier vos données car ils ne changent rien. Vous pouvez les désactiver à tout moment pour revenir à l’état précédent. Cependant, si vous utilisez une vue séparée avec un filtre comme nous l’avons montré ci-dessus, c’est tout aussi sûr.

Étape 1

Pour créer un segment, cliquez dans la section d’administration de Google Analytics et dans « Segments ». Cliquez ensuite sur « + Nouveau segment ».

Tout comme pour les filtres, vous aurez besoin d’un accès « Modification » au niveau « Compte » dans Google Analytics afin de configurer de nouveaux filtres, ou vous n’aurez pas la possibilité de suivre ces prochaines étapes.
Créer un segment dans Google Analytics
Créer un segment dans Google Analytics

Étape 2

Donnez un nom à votre segment (ex : Segment de spam linguistique) et sous le champ Langue, changez le menu déroulant en « ne correspond pas à regex » et saisissez ce qui suit :

.{15,}|\s[^\s]*\s|\.|,|\!|\/

Cliquez ensuite sur « Enregistrer ».

Segment avancé de spam linguistique
Segment avancé de spam linguistique

Et c’est tout. Vous pouvez ensuite sélectionner le segment de langue sur votre tableau de bord Analytics et supprimer « Tous les utilisateurs ». Rappelez-vous, les segments modifient les données en temps réel. Astuce : Vous pouvez créer un tableau de bord/raccourci personnalisé avec votre nouveau segment déjà appliqué pour une visualisation rapide plus tard.

Voir le segment dans Google Analytics
Voir le segment dans Google Analytics

Option 3 : Bloquer le spam linguistique avec des listes de tiers

L’un des aspects les plus ennuyeux du spam est qu’il nous prend beaucoup de temps en tant que propriétaires de sites Web. Nous devons constamment mettre à jour nos segments et nos filtres pour nous assurer que nos données sont aussi exactes que possible. Cependant, il existe des ressources et des outils de tierce partie pour vous aider à accélérer le processus si vous n’avez pas le temps. Vous trouverez ci-dessous quelques options que vous voudrez peut-être consulter :

  • Analytics-Toolkit : Cette société fournit ce qu’ils appellent un Filtre de spam automatique qui est constamment mis à jour pour vous.
  • Analytics Edge offre gratuitement des segments pré-construits que vous pouvez utiliser d’un simple clic. Ceux-ci sont également mises à jour régulièrement.

Et si vous souhaitez en savoir plus sur la meilleure façon de supprimer les spams de Google Analytics, les tutoriels suivants sont très utiles :

Résumé

Comme vous pouvez le voir, il est assez facile de filtrer et d’exclure cette nouvelle tactique de spam. Nous vous recommandons de consulter les analyses de vos sites WordPress et de vous assurer que vos données ne sont pas faussées. Que pensez-vous de la situation du spam linguistique ? Nous trouvons cela tout simplement agaçant et espérons qu’à l’avenir Google pourra aider à lutter contre un plus grand nombre de ces données inutiles que les propriétaires d’entreprises ont maintenant à traiter.

Brian Jackson

Brian a une grande passion pour WordPress, l'utilise depuis plus de dix ans et développe même quelques plugins de qualité. Brian aime les blogs, les films et les randonnées. Connectez avec Brian sur Twitter.