Comment supprimer le spam referrer de vos statistiques ?

Lorsque l'on se préoccupe un tant soit peu de son site web, les données statistiques de celui-ci sont une des parties qui sont régulièrement au centre de l'attention. En effet, avoir un site web qui fonctionne est une chose, savoir comment et pourquoi en est une autre. Mais encore faut il avoir pour cela des données propres pour en tirer des conclusions fiables.

Une des principales plaies du web aujourd'hui est probablement le spam referrer. C'est une technique frauduleuse qui consiste à envoyer de fausses données dans les systèmes d'analyses statistiques d’un site web au moyen de robots. Si cela n’a aucune conséquences sur le référencement des sites victimes, cette "pollution" fausse néanmoins vos statistiques et par ricochet, l’analyse que vous en ferez. L'objectif de cet article est de vous expliquer comment fonctionne ce type de pollution et de vous donner des clefs pour vous en prémunir.

Comment supprimer le spam referrer de vos statistiques ?

Pourquoi le spam referrer ?

Ne cherchez pas plus loin, la principale motivation des spammeurs est encore et toujours l'argent.
Ils ne cherchent qu'à vous inciter à cliquer sur un lien inconnu qui apparait dans votre suivi statistique pour découvrir l'origine de ce visiteur étrange venu sur vos pages. Vu la masse énorme de sites en circulation qui sont concernés par cette pollution, cela permet de générer un trafic monstrueux qu'il est ensuite facile de monétiser.

 

Quel est le problème du spam referrer ?

Comme nous l'avons vu en introduction, le principal souci du spam referrer est de complétement fausser les statistiques du trafic du site pollué.
Afin d'avoir la vision la plus objective possible de ce qui se passe réellement sur vos pages, il est donc essentiel d'avoir des chiffres fiables. La preuve par l'image :

Comment supprimer le spam referrer de vos statistiques ?

Nous constatons ici que trois sites référents sont manifestement du spam referrer : share-buttons.xyz, web-revenue.xyz et с.новым.годом.рф. Ces trois sites représentent à eux seuls, plus de 7.5% des sessions (deuxième colonne) et qu'ils génèrent par ailleurs des taux rebonds (dernière colonne) qui pourrissent la moyenne générale.
Accessoirement, cela vous fait perdre du temps que vous pourriez consacrer le temps mobilisé au nettoyage à faire tout autre chose de bien plus gratifiant.
Il est donc essentiel pour vous de lutter conter le spam referrer, comme nous allons le voir maintenant.

 

Comment bloquer le spam referrer ?

Avant de commencer à sortir la sulfateuse et la dynamite, sachez qu'il existe deux types de spam referrer : le Ghost Spam et le Crawl Spam Referrer . Les deux ne se combattent ni de la même manière ni avec les mêmes armes.

 

Ghost Spam

On l'appelle fantôme (ghost, en anglais) car cette méthode est "invisible". Les spammeurs génèrent des combinaisons aléatoires de profils Google Analytics sous la forme UA-XXXXXX-Y et attaquent directement les rapports sans même passer par votre site web (donc, vous ne la voyez pas). Ils ne vous visent pas en particulier, ils ciblent tout le monde !

C’est la technique la plus utilisée mais également la plus agressive. Du fait de la nature du procédé utilisé, les protections côté serveur sont totalement inefficaces car aucune donnée ne transite via le site web. Dans ce cas présent, il va donc falloir protéger vos données statistiques.

Comment supprimer le spam referrer de vos statistiques ?

Je profite de ce paragraphe pour vous soumettre une petite question qui me trotte dans la tête : pourquoi Google avec ses moyens énormes n'élimine pas définitivement cette pollution de ses data ? (Vous avez 3 heures...)

Vous trouverez de très nombreux tutoriels sur le web qui vous expliquent comment bloquer le Ghost Spam en créant des règles dans votre compte Google Analytics. Si ces solutions sont efficaces, elles sont chronophages et potentiellement risquées si vous ne maîtrisez pas ces manipulations.
Dans son infinie bonté, le Grand Concepteur a créé des outils online qui feront le "job" à votre place (ou presque). Avouez que ce serait dommage ne pas les utiliser !

L'ami @loran750 a très justement attiré mon attention sur le fait qu'un service comme referrer-spam.help faisait également le job mais qu'il récupérait au passage nos données pour les comparer aux leurs. Je vous invite donc à être prudents si vous décidez de l'utiliser.

Accessoirement, on peut tout à fait se passer de Google Analytics pour le suivi statistiques de son site. Il existe quelques alternatives crédibles à ce sujet.

 

Crawl Spam Referrer

L’autre méthode employée par les vilains consiste à envoyer des robots à travers toute la Toile pour crawler les sites web, tout comme le font les robots des moteur de recherche. Contrairement au Ghost Spam, l y a effectivement bien une visite sur le site web. Dans ce cas, il faudra privilégier les solutions de blocages côté serveur qui seront les plus efficaces notamment grâce au fichier .htaccess. Afin de pouvoir mettre en place ce type de blocage, il faut que votre serveur soit de de type Apache (à valider auprès de votre hébergeur).

Si la modification de ce type de fichier ne vous fait pas peur, je vous propose de télécharger un fichier texte contenant un peu plus de 600 spam referrer qu'il vous suffira de copier/coller directement dans votre fichier .htaccess. C'est cadeau !

Si vous ne savez pas comment effectuer cette petite intervention chirurgicale, laissez-moi un message.

Une fois mis en place, vous aurez bloqué la porte d'entrée de votre site à ces robots pourrisseurs de données statistiques.

Comment supprimer le spam referrer de vos statistiques ?

Conclusion

Les spammeurs redoublent d'imagination pour vous inciter à cliquer n'importe où afin de se remplir les poches. La technique du spam referrer, si elle n'est pas nocive pour votre SEO, peut l'être pour votre stratégie de content marketing.
Au delà de ces considérations bassement égoïstes, assainir le web (et non pas l'inverse) devrait être une préoccupation constante de chaque propriétaire de site.

Un dernier conseil : n'oubliez pas de consulter de temps à autre vos rapports statistiques sur les sites référents afin d'y glaner de nouvelles sources de spam referrer que vous ajouterez à vos systèmes de sécurité.


A PROPOS DE L'AUTEUR :
Webmaster freelance passionné par Joomla depuis 2007, Daniel défend la veuve et l'orphelin du web en créant des sites respectueux du W3C. Fort d'une expérience de plusieurs années, il partage ses connaissances dans un état d'esprit open source.
Daniel est également très impliqué dans la communauté Joomla depuis 2014 en étant membre actif de plusieurs projets, conférencier et fondateur du JUG Breizh.