Référencement Logo Joomla Joomla

Le fichier Sitemap.xml

Pour être tout à fait exact, il faudrait plutôt parler des fichiers Sitemap. En effet, comme vous le verrez au cours de cet article, il en existe plusieurs ! Mais pour commencer, nous allons d'abord voir qu'est ce qu'un fichier Sitemap et à quoi il peut nous servir dans le cadre du référencement de notre site web.


Le fichier sitemap.xml


Qu'est ce que le fichier Sitemap ?

Voici la définition contenue dans le glossaire du web :

Un Sitemap est un fichier écrit en langage XML placé à la racine de votre site qui indique aux robots des moteurs de recherche quelles ressources contient votre site web (pages, fichiers, images, etc.). Il donne également des informations complémentaires relatives à ces contenus (date de mise à jour, date de création, etc.). Les sites disposant d'un fichier Sitemap bien tenu sont en général mieux indexés que les autres.

Attention ! Il ne faut surtout pas confondre le fichier Sitemap avec le plan du site (sitemap, en anglais). Le fichier Sitemap s'écrit avec un S majuscule alors que le fichier sitemap (plan du site) s'écrit en minuscules. Ce dernier est généralement un fichier de type HTML qui répertorie les pages les plus importantes au sein d'un site et il est surtout destiné à aider les internautes à parcourir et trouver le contenu qu'ils cherchent sur le site.
Le premier s'adresse uniquement aux robots des moteurs de recherche et n'est lisible que par eux.
Le second est uniquement destiné aux visiteurs humains.


Quels sont les différents types de fichiers Sitemap ?

Il existe principalement quatre sortes de fichiers qui sont :

  • le Sitemap de contenu,
  • le Sitemap pour les images,
  • le Sitemap pour les vidéos,
  • le Sitemap pour le contenu mobile,

Première bonne nouvelle, Joomla! est livré nativement avec un fichier Sitemap de contenu.
Seconde bonne nouvelle, vous pouvez soumettre jusqu'à quatre fichiers Sitemap différents aux moteurs de recherche.


Comment fonctionne le fichier Sitemap ?

Les robots des moteurs de recherche utilisent les fichiers Sitemap pour découvrir et reconnaître quelle est la structure du site et pour mieux planifier leurs activités d'exploration en fonction du fichier qui a été soumis par le propriétaire du site.
Mais ne croyez pas que l'ajout de l'adresse URL d'une nouvelle page Web dans votre fichier Sitemap vous garantit à coup sûr que celle-ci sera automatiquement ajoutée dans l'index de recherche.
Un fichier Sitemap bien rédigé vous assure que les robots tiendront compte des modifications apportées au contenu de votre fichier (et notament, l'ajout de nouveaux contenus). Concrétement, cela améliore les chances de nombreuses pages d'être indexées. A défaut, il vous faudra compter sur la découverte et une analyse basée uniquement sur le crawl des liens du site pour que ces pages soient indexées et ajoutées à l'index de Google.


Exemples :
  • Une entrée de sitemap pour images peut contenir des informations sur la nature de l'image, le type et la licence de l'image,
  • Une entrée de sitemap pour vidéos peut mentionner la durée de la vidéo, sa catégorie et le public qu'elle vise,

Les limites d'un fichier Sitemap

Il existe un certain nombre de règles et de limites imposées aux fichiers Sitemap, soit par le protocole lui-même, soit par les moteurs de recherche :

  • Identifier le site. Le fichier Sitemap doit impérativement indiquer ces informations par défaut : xmlns = http://www.sitemaps.org/schemas/sitemap/0.9
  • Limite de taille. Un fichier Sitemap ne peut pas contenir plus de 50 000 URLs ou 50 MB en taille. Au-delà de cette limite, il faut recourir à un Sitemap d'index et scinder vos sitemaps pour rester sous les 50 000 URLs.
  • Syntaxe à respecter. Les fichiers Sitemap doivent être encodés en UTF-8. Par ailleurs toutes vos URLs doivent avoir la même syntaxe : avec www ou sans www.
  • Localisation du fichier. Idéalement et pour éviter les erreurs de référence ou d'URLS, placez votre fichier Sitemap à la racine de votre site.
  • Des URLs valides. Votre fichier Sitemap ne doit pas contenir d'URLS renvoyant d'erreurs de liens (une erreur de lien est un code réponse HTTP autre que 200) tels que 404 (lien mort ou cassé), 301 redirection permanente) ou 302 (redirection temporaire).
    les moteurs de recherche sont intraitables sur ce point !

Mise en oeuvre du fichier Sitemap

Le processus d'implémentation de ce ficher est relativement simple. Suivez ces étapes dans l'ordre.


  1. Identifiez les pages les plus importantes pour les moteurs de recherche.

    Ici, vous pouvez ignorer les pages du panier d'achat (pour les sites e-commerce), les pages d'identification et de création de compte sur le site ou encore la page


  2. Créez votre Sitemap

    Joomla! est livré nativement avec un Sitemap pour le contenu de votre site. Vous n'avez donc pas à vous en préoccuper.
    Cependant, si vous souhaiter créer des Sitemap supplémentaires pour vos vidéos ou vos images, vous avez deux possibilité :

    • installer une extension tierce dans votre site Joomla!,
    • Utiliser un des nombreux générateurs de Sitemap en ligne,

    Pensez à vérifier que les pages non importantes soient bien exclues de votre fichier.


  3. Faites valider votre fichier Sitemap

    Avant de publier votre fichier pour qu'il soit lu par les robots des moteurs de recherche, vérifiez qu'il ne contient pas d'erreurs et qu'il est bien valide. Il existe pour cela un outil de validation sur le site www.sitemap.org


  4. Placez votre fichier sur votre serveur

    Maintenant que vous avez validé votre fichier Sitemap, placez-le sur le serveur, à la racine de votre site. C'est le meilleur endroit pour éviter les problèmes d'URLS invalides.
    Si vous avez plusieurs Sitemap, ils doivent tous être placés à cet endroit.
    Profitez-en pour mettre à jour votre fichier robots.txt en indiquant l'emplacement du fichier Sitemap aux robots en utilisant cette syntaxe (que vous adapterez selon votre cas) :

    Sitemap: http://www.mon-site-web.fr/sitemap.xml

    Cet ajout permet tout simplement d'indiquer aux robots où est situé votre Sitemap car ils cherchent pas automatiquement ce type de fichier. Il faut donc les aider :)


  5. Déclarez votre fichier Sitemap à Google et Bing

    Pour cela, vous devez utiliser votre compte Google Search Console.
    A partir de la page d'accueil de votre compte, suivez : configuration > Sitemaps > Ajouter / Tester un Sitemap.

    Si vous souhaitez le déclarer également sur votre compte Bing Webaster Tools, suivez : (click Crawl > Sitemaps (XML, Atom, RSS) > Add Feed)


    Pour être complet sur cette partie, sachez que le moteur de recherche russe Yandex et le moteur de recherche chinois Baïdu reconnaissent et utilisent également les Sitemap au format XML.


  6. Mettez à jour votre fichier Sitemap

    Au fur et à mesure que vous alimenterez votre site (ajout de nouveaux contenus, de nouvelles catégories, etc.), il faut penser à mettre à jour votre fichier Sitemap en conséquence.
    Le fichier Sitemap natif de Joomla est mis à jour automatiquement, vous n'avez pas à vous en préoccuper.

    La fréquence de mise à jour du fichier va dépendre de la fréquence de modification et d'ajout du contenu sur votre site.


Pour aller plus loin

Je vous invite à lire les recommandations des principaux moteurs de recherche sur le sujet qui sont un complément indispensable à cet article :


Conclusion

Vous connaissez et maîtrisez maintenant toutes les subtilités concernant l'usage des fichiers Sitemap.
Pour aider les moteurs de recherche à comprendre comment est organisé le contenu sur votre site et leur indiquer quelles sont les pages à visiter en piorité, soumettez leur un fichier Sitemap complet et valide.

 

Merci pour toutes ces informations

Merci web-eau.net d'avoir publié ces articles qui m'aident à mieux référencer mon site !

Montant:   EUR

web-eau.net is not affiliated with or endorsed by the Joomla! Project or Open Source Matters. The Joomla! name and logo is
used under a limited license granted by Open Source Matters the trademark holder in the United States and other countries.