Qu’est-ce qu’une erreur 404 ?

Le 15 mars 2021  SEO

Chaque internaute a découvert la page erreur 404 Not Found (ou page 404 page introuvable) suite aux résultats de recherche sur son navigateur web. Ces erreurs 404 sont fréquentes et doivent être repérées au plus vite car : Elles sont contre-productives pour le référencement naturel de votre site internet. Elles participent à la perte de visiteurs […]

Chaque internaute a découvert la page erreur 404 Not Found (ou page 404 page introuvable) suite aux résultats de recherche sur son navigateur web.

Ces erreurs 404 sont fréquentes et doivent être repérées au plus vite car :

  • Elles sont contre-productives pour le référencement naturel de votre site internet.
  • Elles participent à la perte de visiteurs et donc de prospects potentiels.
  • Elles sont source d’une mauvaise expérience utilisateur.

Comment détecter et corriger ces pages défectueuses ? Cet article vous propose la marche à suivre pour éviter ces messages d’erreurs.

D’où vient l’erreur 404 et comment la détecter ?

Pourquoi ai-je des pages 404 sur mon site ?

L’erreur 404 est un code http envoyé par le serveur web, incapable de vous diriger vers le contenu demandé. La page au code d’erreur 404 s’affiche.

Trois raisons principales sont à l’origine d’une page introuvable redirigée vers ce message d’erreur :

  • la page web demandée a été supprimée: Le moteur de recherche ne peut donc répondre correctement à votre requête.
  • une erreur de syntaxe, une faute de frappe lors de la saisie manuelle de l’adresse URL du site web, menant donc vers une web page inexistante. Ce lien hypertexte doit donc être corrigé manuellement.
  • ou simplement une mauvaise redirection: par exemple lors d’un changement d’hébergeur, la refonte et la migration de votre site web, ou encore une erreur http liée au protocole SSL si la réécriture d’URL ne s’est pas faite correctement (si les URL sont cassées lors du passage au https).

Pourquoi éviter les erreurs 404 ?

Les erreurs 404 impactent le SEO

Les erreurs 404 impactent le positionnement de votre site web.

D’un côté, les URL erronées vont causer des problèmes d’indexation sur les moteurs de recherche. Les pages concernées vont perdre en positionnement, et donc en visibilité (tant est qu’elles étaient positionnées). Lorsque l’internaute arrivera sur la page, il n’y aura aucun contenu pertinent. Il va donc s’en aller, et faire grimper le taux de rebond. En tentant d’explorer cette page, le robot verra qu’elle répond en 404. Google va donc la faire disparaître, plus ou moins rapidement, et il finira par la désindexer.

De plus, si vous receviez des liens entrants (backlinks) sur cette page, ils ne transmettront plus leur jus de lien (également appelé linkjuice ou PageRank) à un contenu que vous souhaitez pousser en termes de référencement naturel. Par extension, vous ne pourrez pas faire de maillage interne et profiter de ce linkjuice de façon optimum en le transmettant à d’autres pages pertinentes.

Les erreurs 404 génèrent une baisse de trafic

Lorsque vous arrivez sur une page 404, vous revenez généralement sur la page de résultat de recherche, ou vous revenez en arrière, vers la page qui vous a dirigé vers l’erreur. Automatiquement, si l’internaute s’en va, vous perdez en trafic. La solution est donc de rediriger cet internaute vers une autre page du site, vers le contenu qui remplace l’erreur, ou vers la page d’accueil. Nous y reviendrons un peu plus loin.

Comment détecter les erreurs 404 de votre site ?

Les erreurs peuvent être d’autant plus nombreuses lors de la création de site internet, d’une migration de données, d’un changement d’hébergement.

Il est possible de détecter une erreur 404 grâce à la Google Search Console (anciennement Google Webmaster tools) dans « Exploration » -> « Erreurs d’exploration ». C’est ici que figurent toutes les erreurs détectées par les robots d’exploration Google.

D’autres outils pour les webmasters existent afin de consulter les URL cassées :

  • Screaming Frog recense les liens morts: tous les liens internes et l’ensemble des URLs qui répondent en 404. Le crawl est gratuit jusqu’à 500 URLs. Si votre site web en contient plus, il sera alors nécessaire d’acheter une licence pour utiliser cet outil. Screaming frog permet également de détecter d’autres paramètres importants comme le contenu dupliqué.
  • Ahref ou Semrush sont des outils payants permettant eux aussi de scanner l’URL des pages Web de votre site, ainsi que de prendre en compte les backlinks.

Comment corriger une erreur 404 ?

Corriger une erreur 404 avec la redirection 301

Corriger les pages d’erreur identifiées est relativement simple. Mais la procédure peut être chronophage.

On peut rediriger les pages d’erreur vers un contenu similaire à celle-ci. Pour cela, il faut utiliser le code de redirection 301 dans un fichier htaccess, un plugin, ou le code source de la page. Cette redirection permet de récupérer le trafic d’une page, en proposant au visiteur un contenu similaire ou une page, ce qui est donc pratique et permet d’éviter la frustration de l’internaute.

De nombreuses pages de messages d’erreur sont aujourd’hui personnalisables afin d’encourager le visiteur à ne pas fuir et poursuivre sa navigation sur le site. Pour le CMS WordPress, il est possible d’installer des plugins afin :

  • d’optimiser au mieux le visuel 404;
  • de produire une page personnalisée à l’image de votre entreprise ;
  • de rediriger vers une page stratégique de votre site (exemple : la Une des actualités).

Le plugin Simple 301 Redirects ou encore Safe Redirect Manager sont des extensions d’une bonne aide pour y parvenir.

Un point de vigilance à apporter. Par méconnaissance du fonctionnement des robots d’indexation dits web crawler (ou Googlebot), la tendance pourrait être de réaliser des redirections systématiques vers la page d’accueil. Nous vous recommandons néanmoins d’analyser chacune des pages répondant en 404 et de les rediriger vers un contenu proche, ou une catégorie.

Corriger une erreur 404 en utilisant le code 410

Vous pouvez aussi désactiver les pages d’erreur 404 et ainsi les supprimer, en les déclarant via le code 410. Cependant, il faut veiller à ce que les pages en question ne reçoivent pas de lien entrant (ou de backlink). Supprimer la page reviendrait à supprimer le backlink, et donc perdre en notoriété et en autorité.

S’il y a des backlinks, redirigez ces pages en redirection 301 vers un contenu similaire ou la page de présentation de l’entreprise. On peut supposer qu’une page avec un ou des backlinks est une page avec un contenu riche d’informations, assez pertinent pour qu’un autre site en parle. Posez-vous la question de savoir s’il était vraiment nécessaire de le supprimer.

Pour désindexer ces pages, vous pouvez les ajouter à la balise noindex dans la section <head> de votre page, ou utiliser le fichier robot.txt pour signaler aux robots de ne pas l’indexer.

Vous pouvez également les ajouter au fichier htaccess.php, avec le code 410.

Enfin, vous pouvez les désindexer sur votre la Google Search Console exploration.

Cela envoie l’information aux robots de crawl de Google de ne pas indexer les pages sélectionnées.

Nous ne sommes jamais à l’abri d’un lien URL défectueux. Il peut être très pénalisant pour la notoriété de votre site e-commerce ou site vitrine, aussi bien d’un point de vue expérience utilisateur (UX), que SEO. Le confort des internautes sur le site est au cœur d’une stratégie digitale réussie.

Plus votre site sera important, plus les liens seront nombreux et la veille complexe. Il est conseillé dans ce cas de faire appel à une agence SEO qui pourra réaliser un audit SEO. L’une des premières étapes de ce diagnostic est d’identifier les éventuels problèmes.