Qu’est-ce qu’un sitemap et comment le créer ?

Le 22 mars 2021  SEO

Après avoir créé l’arborescence et les premiers contenus du site, le sitemap se génère automatiquement en fonction de votre CMS / technologie utilisée. Si ce n’est pas le cas, il est impératif de le créer. Pour savoir si le vôtre est créé, vous pouvez taper https://mon-domaine.fr/sitemap.xml (ou .html si votre fichier a ainsi été codé) […]

Après avoir créé l’arborescence et les premiers contenus du site, le sitemap se génère automatiquement en fonction de votre CMS / technologie utilisée. Si ce n’est pas le cas, il est impératif de le créer.

Pour savoir si le vôtre est créé, vous pouvez taper https://mon-domaine.fr/sitemap.xml (ou .html si votre fichier a ainsi été codé) dans la barre de recherche d’URL sur votre navigateur. Attention, certains CMS génèrent une URL différente telles que : mon-domaine.fr/sitemap/sitemap.xml ou mon-domaine.fr/fr/produit/sitemap.xml, etc. Il faut donc vous renseigner sur le format d’URL utilisé par défaut par votre CMS.

Le sitemap est le plan du site sous forme d’un fichier qui réunit l’ensemble des pages “importantes” que l’on souhaite indexer : les URLs, le niveau d’importance de certaines pages, les liens internes, etc.

Qu’est-ce qu’un sitemap ?

Définition : Le sitemap regroupe les données du site web sous forme d’informations hiérarchisées. C’est un répertoire pour crawler, indexer un site, et donc le référencer. Chaque page est caractérisée par un lien URL. Le fichier comporte la liste de ces liens hypertextes. Il peut également contenir d’autres champs comme la date de la dernière modification. Ce fichier est généralement produit sous deux types de format : format HTML et celui XML. Le HTML est un langage de programmation simple, au même titre que le XML. Le langage XML est à préconiser en priorité pour les robots crawlers, car il permet un meilleur balisage.

A quoi sert un sitemap ?

Actuellement, l’utilisation d’un XML sitemap a pour vocation de favoriser la compréhension des contenus des sites internet par les robots des moteurs de recherche. Ce fichier simplifie le travail du Googlebot. Il permet un grand nombre de pages indexées et ainsi d’optimiser la stratégie SEO.

Le sitemap est un outil d’exploration et de reconnaissance des pages du site web pour les robots d’indexation de Google.

mobile
AGENCE SEO
SEO TECHNIQUE

Le sitemap est-il indispensable ?

Si votre site internet est complexe, les liens URL seront donc nombreux et le maillage interne important. Le sitemap est donc un plus.

À noter, si vous diffusez des vidéos, le fichier sitemap XML vous permettra une meilleure indexation de celles-ci. Il permet la lecture des métadonnées. Il en est de même pour les images, les actualités ou le contenu plus difficilement analysable. Les extensions de syntaxe sitemaps seront alors utilisées.

Enfin, un sitemap au format XML sera lu par les robots de Google et des autres moteurs de recherche. Si Google alloue un budget crawl trop faible à votre site, il se peut que certaines pages qui ne soient pas dans le sitemap passent au travers du scan et ne soient ainsi pas indexées, ou que la fréquence de passage du robot google soit faible. Le sitemap donne plus de chance à ces pages, parfois peu maillées, d’être crawler.

Sitemap : un enjeu SEO

Le sitemap donne aussi des informations complémentaires sur vos pages : date de création, fréquence de mise à jour, maillage interne etc.

Si vous souhaitez créer un site e-commerce, l’enjeu sera d’être visible et donc reconnu par le moteur de recherche. Les sites e-commerce sont complexes car ils ont généralement des milliers d’URL pour les plus petits, lié au nombre de produit avec parfois des déclinaisons. Faire indexer le contenu d’un tel site représente un enjeu considérable. Il faut penser aux redirections, à la mise en place d’URL canonique pour éviter le duplicate content, etc. Un audit SEO pour la réalisation d’une stratégie de référencement sur-mesure est fortement conseillé.

La mise en place d’une stratégie de référencement SEO technique est indispensable. Il faut utiliser des outils audit SEO complet, de vérifier la présence d’un sitemap optimisé, d’un robot.txt à jour, d’une bonne gestion des redirections ou encore le respect du protocole HTTPS.

Voici quelques conseils pour produire un fichier sitemap de qualité :

  • Les URLs doivent être complètesen commençant par http://www.example.com/ (ou https avec le protocole SSL si vous avez mis en place un certificat https, que nous vous recommandons vivement !).
  • Les liens doivent être indexables et crawlables (pas d’erreur 404 ou 410, pas de balise meta robots en noindex, etc.).
  • Pas de redirection en 301 (sauf si nécessaire) ou 302, tous les URLs en code 200 (code lien existant).
  • Pas de contenu dupliqué, texte original, uniquement des nouvelles pages web dites canoniques.

Comment créer un sitemap pour Google ?

Certains CMS proposent des plugins de création et gestion de fichier sitemap, utile quand vous ne voulez pas toucher au code. Si vous choisissez le CMS WordPress pour le SEO, il sera utile d’installer une extension comme le plugin Yoast, générateur de fichier sitemap.

Il est également possible de le créer avec des outils en ligne comme web-site-map.com ou xml-sitemaps.com mais ceux-ci sont limités par le nombre d’URL.

Screaming frog est une solution pratique pour scanner les URL de son site. Il faut ensuite créer un fichier bloc note ou notepad++, utiliser quelques lignes de codes et y mettre les URL à indexer. Il est conseillé d’encoder le fichier en UTF-8. Celui-ci ne doit pas inclure plus de 50 000 URL et ne devrait pas dépasser 10mo.

mobile
AGENCE SEO
SEO TECHNIQUE

Comment soumettre son sitemap pour google ?

Ce fichier sera à soumettre rapidement à la Google Search Console exploration (anciennement Google Webmaster Tools).Vous pouvez l’envoyer directement via l’outil Google Search Console (sélectionnez votre site sur la page d’accueil, cliquez sur sitemaps).

Vous pouvez également renseigner l’adresse de votre fichier sitemap.xml via le fichier robots.txt. Il est préconisé de placer le sitemap en début ou fin du document robots.txt.

Pour rappel, le fichier robost.txt donne des directives aux Robots de Google lui permettant d’explorer ou non certaines parties du site. En le plaçant à la racine du site, c’est la première chose que consultera Googlebot.

En résumé :

Contenu optimisé + Netlinking + SEO technique = Donne toutes ses chances à votre site d’apparaître dans la première page des résultats de recherche.