Spam referrer: ne subissez plus cette pollution !

Lorsque l'on se préoccupe un tant soit peu de son site web, les données statistiques de celui-ci sont une des parties qui sont régulièrement au centre de l'attention. En effet, avoir un site web qui fonctionne est une chose, savoir comment et pourquoi en est une autre. Mais encore faut il avoir pour cela des données propres pour en tirer des conclusions fiables.

Une des principales plaies du web aujourd'hui est probablement le spam referrer. C'est une technique frauduleuse qui consiste à envoyer de fausses données dans les systèmes d'analyses statistiques d’un site web au moyen de robots. Si cela n’a aucune conséquences sur le référencement des sites victimes, cette "pollution" fausse néanmoins vos statistiques et par ricochet, l’analyse que vous en ferez. L'objectif de cet article est de vous expliquer comment fonctionne ce type de pollution et de vous donner des clefs pour supprimer le spam referrer.

Pourquoi le spam referrer ?

Ne cherchez pas plus loin, la principale motivation des spammeurs est encore et toujours l'argent. Ils ne cherchent qu'à vous inciter à cliquer sur un lien inconnu qui apparait dans votre suivi statistique pour découvrir l'origine de ce visiteur étrange venu sur vos pages. Vu la masse énorme de sites en circulation qui sont concernés par cette pollution, cela permet de générer un trafic monstrueux qu'il est ensuite facile de monétiser.

C'est quoi le problème ?

Comme nous l'avons vu en introduction, le principal souci du spam referrer est de complétement fausser les statistiques du trafic du site pollué.
Afin d'avoir la vision la plus objective possible de ce qui se passe réellement sur vos pages, il est donc essentiel d'avoir des chiffres fiables. La preuve par l'image :

Comment supprimer le spam referrer de vos statistiques ?

Nous constatons ici que trois sites référents sont manifestement du spam referrer : share-buttons.xyz, web-revenue.xyz et с.новым.годом.рф. Ces trois sites représentent à eux seuls, plus de 7.5% des sessions (deuxième colonne) et qu'ils génèrent par ailleurs des taux rebonds (dernière colonne) qui pourrissent la moyenne générale. Accessoirement, cela vous fait perdre du temps que vous pourriez consacrer à faire tout autre chose de bien plus gratifiant.

Il est donc essentiel pour vous de lutter conter le spam referrer, comme nous allons le voir maintenant.

Comment supprimer le spam referrer ?

Avant de commencer à sortir la sulfateuse et la dynamite, sachez qu'il existe deux types de spam referrer : le Ghost Spam et le Crawl Spam Referrer . Les deux ne se combattent ni de la même manière ni avec les mêmes armes.

Ghost Spam

On l'appelle fantôme (ghost, en anglais) car cette méthode est "invisible". Les spammeurs génèrent des combinaisons aléatoires de profils Google Analytics sous la forme UA-XXXXXX-Y et attaquent directement les rapports sans même passer par votre site web (donc, vous ne la voyez pas). Ils ne vous visent pas en particulier, ils ciblent tout le monde !

C’est la technique la plus utilisée mais également la plus agressive. Du fait de la nature du procédé utilisé, les protections côté serveur sont totalement inefficaces car aucune donnée ne transite via le site web. Dans ce cas présent, il va donc falloir protéger vos données statistiques.

Je profite de ce paragraphe pour vous soumettre une petite question qui me trotte dans la tête : pourquoi Google avec ses moyens énormes n'élimine pas définitivement cette pollution de ses data ? (Vous avez 3 heures...)

Vous trouverez de très nombreux tutoriels sur le web qui vous expliquent comment bloquer le Ghost Spam en créant des règles dans votre compte Google Analytics. Si ces solutions sont efficaces, elles sont chronophages et potentiellement risquées si vous ne maîtrisez pas ces manipulations.
Dans son infinie bonté, le Grand Concepteur a créé des outils online qui feront le "job" à votre place (ou presque). Avouez que ce serait dommage ne pas les utiliser !

Attention toutefois, si un service comme referrer-spam.help fait le job, sachez qu'il récupère au passage nos données pour les comparer aux leurs. Je vous invite donc à être prudents si vous décidez de l'utiliser.

Accessoirement, on peut tout à fait se passer de Google Analytics pour le suivi statistiques de son site. Il existe plusieurs alternatives crédibles si besoin.

Crawl Spam Referrer

L’autre méthode employée par les vilains consiste à envoyer des robots à travers toute la Toile pour crawler les sites web, tout comme le font les robots des moteur de recherche. Contrairement au Ghost Spam, il y a effectivement bien une visite sur le site web. Dans ce cas, il faudra privilégier les solutions de blocages côté serveur qui seront les plus efficaces notamment grâce au fichier .htaccess. Afin de pouvoir mettre en place ce type de blocage, il faut que votre serveur soit de de type Apache (à valider auprès de votre hébergeur).

Si la modification de ce type de fichier ne vous fait pas peur, voici un fichier texte contenant un peu plus de 600 spam referrer qu'il vous suffira de copier/coller directement dans votre fichier .htaccess. C'est cadeau !

Si vous ne savez pas comment effectuer cette petite intervention chirurgicale, laissez-moi un message.

Une fois mis en place, vous aurez bloqué la porte d'entrée de votre site à ces robots pourrisseurs de données statistiques.

Conclusion

Les spammeurs redoublent d'imagination pour vous inciter à cliquer n'importe où afin de se remplir les poches. Cette technique, si elle n'est pas nocive pour votre SEO, peut l'être pour votre stratégie de content marketing. Il faut donc supprimer le spam referrer de vos statistiques.
Au delà de ces considérations bassement égoïstes, assainir le web (et non pas l'inverse) devrait être une préoccupation constante de chaque propriétaire de site.

Un dernier conseil : n'oubliez pas de consulter de temps à autre vos rapports statistiques sur les sites référents afin d'y glaner de nouvelles sources de spam referrer que vous ajouterez à votre système de sécurité.

Lorsque l'on se préoccupe un tant soit peu de son site web, les données statistiques de celui-ci sont une des parties qui sont régulièrement au centre de l'attention. En effet, avoir un site web qui fonctionne est une chose, savoir comment et pourquoi en est une autre. Mais encore faut il avoir pour cela des données propres pour en tirer des conclusions fiables.

Une des principales plaies du web aujourd'hui est probablement le spam referrer. C'est une technique frauduleuse qui consiste à envoyer de fausses données dans les systèmes d'analyses statistiques d’un site web au moyen de robots. Si cela n’a aucune conséquences sur le référencement des sites victimes, cette "pollution" fausse néanmoins vos statistiques et par ricochet, l’analyse que vous en ferez. L'objectif de cet article est de vous expliquer comment fonctionne ce type de pollution et de vous donner des clefs pour supprimer le spam referrer.

Pourquoi le spam referrer ?

Ne cherchez pas plus loin, la principale motivation des spammeurs est encore et toujours l'argent. Ils ne cherchent qu'à vous inciter à cliquer sur un lien inconnu qui apparait dans votre suivi statistique pour découvrir l'origine de ce visiteur étrange venu sur vos pages. Vu la masse énorme de sites en circulation qui sont concernés par cette pollution, cela permet de générer un trafic monstrueux qu'il est ensuite facile de monétiser.

C'est quoi le problème ?

Comme nous l'avons vu en introduction, le principal souci du spam referrer est de complétement fausser les statistiques du trafic du site pollué.
Afin d'avoir la vision la plus objective possible de ce qui se passe réellement sur vos pages, il est donc essentiel d'avoir des chiffres fiables. La preuve par l'image :

Comment supprimer le spam referrer de vos statistiques ?

Nous constatons ici que trois sites référents sont manifestement du spam referrer : share-buttons.xyz, web-revenue.xyz et с.новым.годом.рф. Ces trois sites représentent à eux seuls, plus de 7.5% des sessions (deuxième colonne) et qu'ils génèrent par ailleurs des taux rebonds (dernière colonne) qui pourrissent la moyenne générale. Accessoirement, cela vous fait perdre du temps que vous pourriez consacrer à faire tout autre chose de bien plus gratifiant.

Il est donc essentiel pour vous de lutter conter le spam referrer, comme nous allons le voir maintenant.

Comment supprimer le spam referrer ?

Avant de commencer à sortir la sulfateuse et la dynamite, sachez qu'il existe deux types de spam referrer : le Ghost Spam et le Crawl Spam Referrer . Les deux ne se combattent ni de la même manière ni avec les mêmes armes.

Ghost Spam

On l'appelle fantôme (ghost, en anglais) car cette méthode est "invisible". Les spammeurs génèrent des combinaisons aléatoires de profils Google Analytics sous la forme UA-XXXXXX-Y et attaquent directement les rapports sans même passer par votre site web (donc, vous ne la voyez pas). Ils ne vous visent pas en particulier, ils ciblent tout le monde !

C’est la technique la plus utilisée mais également la plus agressive. Du fait de la nature du procédé utilisé, les protections côté serveur sont totalement inefficaces car aucune donnée ne transite via le site web. Dans ce cas présent, il va donc falloir protéger vos données statistiques.

Je profite de ce paragraphe pour vous soumettre une petite question qui me trotte dans la tête : pourquoi Google avec ses moyens énormes n'élimine pas définitivement cette pollution de ses data ? (Vous avez 3 heures...)

Vous trouverez de très nombreux tutoriels sur le web qui vous expliquent comment bloquer le Ghost Spam en créant des règles dans votre compte Google Analytics. Si ces solutions sont efficaces, elles sont chronophages et potentiellement risquées si vous ne maîtrisez pas ces manipulations.
Dans son infinie bonté, le Grand Concepteur a créé des outils online qui feront le "job" à votre place (ou presque). Avouez que ce serait dommage ne pas les utiliser !

Attention toutefois, si un service comme referrer-spam.help fait le job, sachez qu'il récupère au passage nos données pour les comparer aux leurs. Je vous invite donc à être prudents si vous décidez de l'utiliser.

Accessoirement, on peut tout à fait se passer de Google Analytics pour le suivi statistiques de son site. Il existe plusieurs alternatives crédibles si besoin.

Crawl Spam Referrer

L’autre méthode employée par les vilains consiste à envoyer des robots à travers toute la Toile pour crawler les sites web, tout comme le font les robots des moteur de recherche. Contrairement au Ghost Spam, il y a effectivement bien une visite sur le site web. Dans ce cas, il faudra privilégier les solutions de blocages côté serveur qui seront les plus efficaces notamment grâce au fichier .htaccess. Afin de pouvoir mettre en place ce type de blocage, il faut que votre serveur soit de de type Apache (à valider auprès de votre hébergeur).

Si la modification de ce type de fichier ne vous fait pas peur, voici un fichier texte contenant un peu plus de 600 spam referrer qu'il vous suffira de copier/coller directement dans votre fichier .htaccess. C'est cadeau !

Si vous ne savez pas comment effectuer cette petite intervention chirurgicale, laissez-moi un message.

Une fois mis en place, vous aurez bloqué la porte d'entrée de votre site à ces robots pourrisseurs de données statistiques.

Conclusion

Les spammeurs redoublent d'imagination pour vous inciter à cliquer n'importe où afin de se remplir les poches. Cette technique, si elle n'est pas nocive pour votre SEO, peut l'être pour votre stratégie de content marketing. Il faut donc supprimer le spam referrer de vos statistiques.
Au delà de ces considérations bassement égoïstes, assainir le web (et non pas l'inverse) devrait être une préoccupation constante de chaque propriétaire de site.

Un dernier conseil : n'oubliez pas de consulter de temps à autre vos rapports statistiques sur les sites référents afin d'y glaner de nouvelles sources de spam referrer que vous ajouterez à votre système de sécurité.

Daniel Dubois - auteur à web-eau.net

A propos de Daniel

Passionné par le Web depuis 2007, Daniel défend la veuve et l'orphelin du web en créant des sites respectueux du W3C. Fort de son expérience, il partage ses connaissances dans un état d'esprit open source. Très impliqué en faveur du CMS Joomla depuis 2014, il est également conférencier et fondateur du Joomla User Group Breizh.

web-eau.net

29800 Landerneau

06 74 50 27 99

daniel@web-eau.net