Pour être tout à fait exact, il faudrait plutôt parler des fichiers Sitemap.xml. En effet, comme vous le verrez au cours de cet article, il en existe plusieurs ! Mais pour commencer, nous allons d'abord voir qu'est ce qu'un fichier Sitemap.xml et à quoi il peut nous être utile dans le cadre du référencement d'un site web.

Qu'est ce que le fichier Sitemap ?

Voici la définition contenue dans le glossaire du web :

Un Sitemap est un fichier écrit en langage XML placé à la racine de votre site qui indique aux robots des moteurs de recherche quelles ressources contient votre site web (pages, fichiers, images, etc.). Il donne également des informations complémentaires relatives à ces contenus (date de mise à jour, date de création, etc.). Les sites disposant d'un fichier Sitemap bien tenu sont en général mieux indexés que les autres.

Attention ! Il ne faut surtout pas confondre le fichier Sitemap avec le plan du site (sitemap, en anglais). Le fichier Sitemap.xml s'écrit avec un S majuscule alors que le fichier sitemap (plan du site) s'écrit en minuscules. Ce dernier est généralement un fichier de type HTML qui répertorie les pages les plus importantes d'un site Web et il est surtout destiné à aider les internautes à retrouver leur chemin sur le site.
Le premier s'adresse uniquement aux robots des moteurs de recherche et n'est lisible que par eux.
Le second est uniquement destiné aux visiteurs humains.

Quels sont les différents types de fichiers Sitemap ?

  • le Sitemap pour le contenu standard,
  • le Sitemap pour les fichiers images,
  • le Sitemap pour les fichiers vidéos,
  • le Sitemap pour le contenu mobile,
  • le Sitemap pour Google News,
  • le Sitemap pour les fichiers XML de Google Maps,

Les différents fichiers Sitemap.xml

Première bonne nouvelle, Joomla est livré nativement avec un fichier Sitemap de contenu.
Seconde bonne nouvelle, vous pouvez soumettre jusqu'à quatre fichiers Sitemap.xml différents aux moteurs de recherche.

Comment fonctionne un fichier Sitemap.xml ?

Les robots des moteurs de recherche utilisent les fichiers Sitemap pour découvrir et reconnaître quelle est la structure du site et pour mieux planifier leurs activités d'exploration en fonction du fichier qui a été soumis par le propriétaire du site.

Mais ne croyez pas que l'ajout de l'adresse URL d'une nouvelle page Web dans votre fichier Sitemap vous garantit à coup sûr que celle-ci sera automatiquement ajoutée dans l'index du moteur de recherche.

Un fichier Sitemap bien rédigé vous assure que les robots tiendront compte des modifications apportées au contenu de votre fichier (et notament, l'ajout de nouveaux contenus). Concrétement, cela améliore les chances de nombreuses pages d'être indexées. A défaut, il vous faudra compter sur la découverte et une analyse basée uniquement sur le crawl des liens du site pour que ces pages soient indexées et ajoutées à l'index du moteur de recherche.


Exemples :
  • Une entrée de sitemap pour images peut contenir des informations sur la nature de l'image, le type et la licence de l'image,
  • Une entrée de sitemap pour vidéos peut mentionner la durée de la vidéo, sa catégorie et le public qu'elle vise,

Les limites d'un fichier Sitemap

Il existe un certain nombre de règles et de limites imposées aux fichiers Sitemap, soit par le protocole lui-même, soit par les moteurs de recherche :

  • Identifier le site. Le fichier Sitemap doit impérativement indiquer ces informations par défaut : xmlns = https://www.sitemaps.org/schemas/sitemap/0.9
  • Limite de taille. Un fichier Sitemap ne peut pas contenir plus de 50 000 URLs ou 50 MB en taille. Au-delà de cette limite, il faut recourir à un Sitemap d'index et scinder vos sitemaps pour rester sous les 50 000 URLs.
  • Syntaxe à respecter. Les fichiers Sitemap doivent être encodés en UTF-8. Par ailleurs toutes vos URLs doivent avoir la même syntaxe : avec www ou sans www.
  • Localisation du fichier. Idéalement et pour éviter les erreurs de référence ou d'URLS, placez votre fichier Sitemap à la racine de votre site.
  • Des URLs valides. Le fichier Sitemap.xml que vous soumettez ne doit pas contenir d'URLS renvoyant d'erreurs de liens (une erreur de lien est un code réponse HTTP autre que 200) tels que 404 (lien mort ou cassé), 301 redirection permanente) ou 302 (redirection temporaire).
    les moteurs de recherche sont intraitables sur ce point !

Mise en oeuvre du fichier Sitemap

Le processus d'implémentation de ce ficher est relativement simple. Suivez ces étapes dans l'ordre.


  1. Identifiez les pages les plus importantes pour les moteurs de recherche.

    Ici, vous pouvez ignorer les pages du panier d'achat (pour les sites e-commerce), les pages d'identification et de création de compte sur le site ou encore la page "Mentions légales".


  2. Créez votre Sitemap

    Joomla est livré nativement avec un Sitemap pour le contenu de votre site. Vous n'avez donc pas à vous en préoccuper.
    Cependant, si vous souhaiter créer des Sitemap supplémentaires pour vos vidéos ou pour vos images, vous avez deux possibilité :

    • installer une extension tierce dans votre site Joomla,
    • Utiliser un des nombreux générateurs de Sitemap en ligne,

    Pensez à vérifier que les pages non importantes soient bien exclues de votre fichier.


  3. Faites valider votre fichier Sitemap

    Avant de publier votre fichier pour qu'il soit lu par les robots des moteurs de recherche, vérifiez qu'il ne contient pas d'erreurs et qu'il est bien valide. Il existe pour cela un outil de validation sur le site www.sitemap.org


  4. Placez votre fichier sur votre serveur

    Maintenant que vous avez validé votre fichier Sitemap, placez-le sur le serveur, à la racine de votre site. C'est le meilleur endroit pour éviter les problèmes d'URLS invalides.
    Si vous avez plusieurs fichiers Sitemap, ils doivent tous être placés à cet endroit.

    Profitez-en pour mettre à jour votre fichier robots.txt en indiquant l'emplacement du fichier Sitemap aux robots en utilisant cette syntaxe (que vous adapterez selon votre cas) :

    Sitemap: https://www.mon-site-web.fr/sitemap.xml

    Cet ajout permet tout simplement d'indiquer aux robots où est situé votre fichier Sitemap car ils ne cherchent pas automatiquement ce type de fichier lors du crawl.


  5. Déclarez votre fichier Sitemap aux moteurs de recherche

    Pour Google, vous devez utiliser votre compte Google Search Console.
    A partir de la page d'accueil de votre compte, suivez Sitemaps > Ajouter un Sitemap.


    Si vous souhaitez le déclarer également sur votre compte Bing Webaster Tools, suivez Sitemaps depuis le menu gauche.


    Pour être complet sur cette partie, sachez que le moteur de recherche russe Yandex et le moteur de recherche chinois Baïdu reconnaissent et utilisent également les Sitemap au format XML.


  6. Mettez à jour votre fichier Sitemap

    Au fur et à mesure que vous alimenterez votre site (ajout de nouveaux contenus, de nouvelles catégories, etc.), il faut penser à mettre à jour votre fichier Sitemap en conséquence.
    Le fichier Sitemap natif de Joomla est mis à jour automatiquement, vous n'avez pas à vous en préoccuper.

    La fréquence de mise à jour du fichier va dépendre de la fréquence de modification et d'ajout du contenu sur votre site.


Pour aller plus loin

Je vous invite à lire les recommandations des principaux moteurs de recherche sur le sujet qui sont un complément indispensable à cet article :

Conclusion

Vous connaissez et maîtrisez maintenant toutes les subtilités concernant l'usage des fichiers Sitemap.xml
Pour aider les moteurs de recherche à comprendre comment est organisé le contenu sur votre site et leur indiquer quelles sont les pages à visiter en piorité, soumettez leur un fichier Sitemap complet et valide.

web-eau.net

29800 Landerneau

06 74 50 27 99

daniel@web-eau.net