Référencement Logo Joomla Joomla

Les URLs dupliquées

Pour être franc, personne n'est à l'abri d'avoir une ou plusieurs URLs qui pointe vers la même page de son site. En effet, comme vous le verrez au cours de cet article, il peut y avoir plusieurs URLs pour une seule et même page. Et les moteurs de recherche n'aiment pas vraiment ça ! Mais pour commencer, nous allons d'abord voir qu'est ce qu'une URL dupliquée, pourquoi cela peut être préjudiciable pour le référencement de votre site web et comment s'en prémunir efficacement.


Les URLs dupliquées


URL ou contenu dupliqué ?

Dans les faits, ce ne sont pas les URLs qui sont dupliquées mais le contenu vers lesquelles ces multiples URLs renvoient l'internaute. Voyons donc d'abord ce qu'est le contenu dupliqué.


Qu'est ce que le contenu dupliqué ?

Voici la définition contenue dans le glossaire du web :

Le contenu dupliqué, c'est le fait de pouvoir accéder au même contenu à partir de plusieurs URLs différentes.
Il faut néanmoins différencier deux types de contenu dupliqué :
  • le contenu dupliqué externe : c'est le contenu d'un site qui est recopié totalement ou partiellement sur un autre site,
  • le contenu dupliqué interne : la même page d'un site web est accessible par plusieurs URLs.

Bon à savoir : il ne faut pas confondre URL dupliquée et URL identique.
La première indique un contenu qui est accessible via plusieurs URLs différentes.
La seconde est impossible car Joomla! ne permet pas de créer deux URLs rigoureusement identiques.

Quel est le problème du contenu dupliqué ?

Pour les moteurs de recherche, et notament pour notre ami Google, une URL est associé à une page de contenu.
Donc si deux ou plusieurs URLs affichent le même contenu, Google ne sait pas qu'il s'agit de la même page et ne pourra pas identifier clairement quelle est la page la plus pertinente pour les internautes. il va donc considérer ces URLs comme étant dupliquées.
Conséquence : le moteur de recherche va donc reléguer l'une des deux URLs au fond des résultats de recherche tandis que l'autre risque d’être très mal positionnée. Dans les deux cas, ce n'est pas brillant.
Sachez qu'un trop fort taux de contenu dupliqué sur un site risque de le pénaliser dans sa totalité. Il ne faut donc pas prendre ce problème à la légère !


Les URLs dupliquée et Joomla!

Soyons honnêtes, il existe un problème avec les URLs canoniques (canonical) dans Joomla!, même si ce problème n'est pas spécifique à ce CMS...

De quoi parle-t-on ? Une URL canonique doit fournir une URL unique quelle que soit la méthode d'appel de tel ou telle page. On parle ici de l'adresse unique d'accès à un article. Le problème avec le plugin système SEF de Joomla! est que les URLs canonique ne le sont pas.
En effet, selon la méthode d'appel d'une page, l'URL canonique peut-être différente. Pour constater cela, il suffit d'aller regarder dans son compte Google Search Console où vous verrez des balises titre et meta description en double (dupliquées) en grand nombre.


Pour éviter d'être pénalisé du point de vue du référencement, nous allons donc devoir remédier au problème du contenu dupliqué interne. Et pour cela, nous allons voir qu'il existe plusieurs solutions.


1. Les liens de menu

Vous devez commencé par identifier l'origine de vos URLs dupliquées sur votre site web.
Supposons que le contenu de votre site soit affiché via deux menus (un principal et un secondaire) et que vous ayez fait pointé un lien de chaque menu vers le même article :

http://www.mon-site-web.fr/categorie/titre-de-mon-article.html

Dans ce cas, vous avez certainement modifié l'alias de l'URL d'un des deux liens de menu car Joomla! ne permet pas d'avoir deux URLs identiques.

Commencez par définir quel est le menu à partir duquel votre contenu doit être accesible.
Choisissons le menu principal dans cet exemple.
Ouvrez alors le lien de menu du menu secondaire qui pointe vers le même article.
Au lieu de choisir "Article" comme type de lien de menu, sélectionnez "URL externe" dans les "Liens divers".
Copiez / coller ici l'URL du lien de l'article relié au menu principal.
Voilà, c'est aussi simple que ça (dans ce cas). Votre URL externe permet de spécifier la même URL, ce qui supprime le problème.


Si vous souhaitez avoir plusieurs éléments de menu qui pointent vers le même article, ne recréez surtout pas un nouveau lien de menu de type "Article" mais choisissez un lien de menu de type "Alias de lien de menu". Cela permet de récupérer les paramètres liés à l'alias sélectionné (c'est à dire de reprendre l'URL originale du sous élément de menu vers lequel pointe cet alias). Dans ce cas, Joomla ne générera pas de nouvelles URLs.

Liens de menu Joomla


2. Indiquer la balise canonical

Si vous n'êtes pas en mesure d'identifier l'origine des vos URLs dupliquées, vous avez probablement un souci de canonicalisation de vos URLs.

Il faut donc ajouter une balise du type <link href="/url-canonique-de-votre-contenu"/ rel="canonical"> sur chacune des pages concernées.
En définissant ainsi la balise canonical sur la bonne page, vous indiquez aux moteurs de recherche quelle est la page à indexer et quelles sont les URLs à ne pas indexer.
Mais si vous ne définissez pas de façon correcte cette balise, vous risquez d'obtenir un résultat catastrophique pour votre référencement.

Dans ce cas, la meilleure solution pour mette en place cette balise simplement est sans doute d'installer une extension tierce.
Le Joomla extensions directory dispose d'une section exclusivement réservée à la canonicalisation des URLs.

Ainsi, toutes les pages dupliquées de Joomla contiendront cette balise dans la partie <head> de leur page. Vous indiquerez à Google de ne pas indexer les URLs dupliquées, qui restent nénamoins toujours accessibles.


3. Définir des règles dans le fichier .htaccess

Grâce au fichier .htaccess présent à la racine de votre site de Joomla, vous avez la possibilité de résoudre un nombre important d'URLs dupliquées en indiquant certaines règles au serveur.


  • Choisissez avec ou sans les www. Si vous ne définissez pas de règles claires et strictes sur ce point, votre site sera accessible sur les deux formes du nom de domaine et donc, toutes vos URLs seront considéres comme dupliquées. Ajoutez cette règle dans votre fichier .htaccess :

    RewriteEngine on
    RewriteCond %{HTTP_HOST} ^mon-site-web.fr$
    RewriteRule ^(.*) http://www.mon-site-web.fr/$1 [QSA,L,R=301]

  • Supprimez les slash à la fin de vos URLs. Dans le même ordre d'idée, votre site (et toutes ses URLs) est accessible via http://www.mon-site-web.fr mais également via http://www.mon-site-web.fr/. Pour les mêmes raisons évoquées ci-dessus, nous allons donc indiquer au serveur de ne retenir que la version sans le slash. Ajoutez cette règle dans votre fichier .htaccess :

    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]
    

  • Définissez des redirection permanentes. Pour rediriger les requêtes d'une URL vers une autre, l'utilisation de la redirection 301 est une solution possible et efficace. Techniquement, cela revient à indiquer l'adresse URL d'une page et de renvoyer les internautes (et les moteurs de recherche) vers l'adresse canonique. Ajoutez cette règle dans votre fichier .htaceess :

    RewriteCond %{HTTP_HOST} ^www.mon-site-web.fr/url-dupliquee
    RewriteRule ^(.*) http://www.mon-site-web.fr/url-canonique [QSA,L,R=301]
    

    Bon à savoir :Il est également possible de définir des redirections depuis le panneau d'administration de Joomla! via le composant Redirections (et son plugin associé).

4. Utiliser le fichier robots.txt

Nous l'avons vu au cours de l'article consacré à ce fichier qu'il est tout à fait possible de donner instruction aux robots des moteurs de recherche de ne pas indexer les URLs contenant certains caractères ou paramètres. Ajoutez cette règle dans votre fichier robots.txt :

Disallow: /*?* 
Disallow: /*?
Disallow: /*& 

Pour aller plus loin

Je vous invite à lire les recommandations de Google sur le sujet qui sont un complément indispensable à cet article : https://support.google.com/webmasters/answer/66359?hl=fr.


Si vous souhaitez approfondir ce sujet, je vous conseille de lire : Duplicate content, ce que vous devez savoir.


Conclusion

Vous connaissez et maîtrisez maintenant toutes les subtilités qui permettent d'éviter et de supprimer les URLs dupliquées sur votre site.
Vérifiez très régulièrement dans votre compte Google Search Console que de nouvelles URLs dupliquées n'aient pas été indexées. Si vous avez suivi les conseils données ci-dessus, vous devriez en venir à bout en quelques jours / seamines suivant la taille de votre site.

 

Merci pour toutes ces informations

Merci web-eau.net d'avoir publié ces articles qui m'aident à mieux référencer mon site !

Montant:   EUR

web-eau.net is not affiliated with or endorsed by the Joomla! Project or Open Source Matters. The Joomla! name and logo is
used under a limited license granted by Open Source Matters the trademark holder in the United States and other countries.