Les messages d’erreur de WordPress ont tendance à être déroutants et difficiles à résoudre, mais heureusement l’erreur « Votre sitemap semble être une page HTML » n’en fait pas partie.

Si vous avez rencontré ce problème, vous vous demandez sans doute ce que signifie cette erreur, ce qui ne va pas avec le fait que votre sitemap soit au format HTML, et comment vous pouvez résoudre ce problème. Et si votre sitemap est déjà au bon format et que vous voyez toujours cette erreur ?

Nous allons tout vous expliquer : le fonctionnement d’un sitemap, le format dans lequel il doit être présenté et les différentes façons de résoudre ce problème.

Consultez notre guide vidéo pour corriger l’erreur « Votre plan de site semble être une page HTML » :

Qu’est-ce qu’un sitemap?

Savez-vous comment les moteurs de recherche trouvent votre site web ? La réponse se trouve dans un petit robot très pratique appelé « web crawler », un outil automatisé envoyé par les moteurs de recherche pour indexer les pages de votre site.

Avec littéralement des millions de pages sur le web, la collecte d’informations sur chaque site serait impossible avec des humains. Les robots d’exploration du web parcourent l’internet, mettant en mémoire les informations de chaque page et de chaque média.

Cela semble assez simple, mais Google ne sait pas automatiquement quand vous ajoutez une nouvelle page à votre site, comme lorsque vous publiez un article de blog ou que vous lancez un nouveau produit dans votre boutique. Il envoie périodiquement un robot d’exploration pour visiter votre site et voir si quelque chose a changé, mais le processus n’est pas instantané.

Lorsque vous avez un site volumineux, il est facile pour le robot d’exploration de ne pas voir les pages clés, même après plusieurs visites. C’est surtout un problème lorsque ces pages ne sont pas souvent liées.

C’est là que les sitemaps interviennent pour aider les robots d’exploration. Ces fichiers XML sont différents des pages ordinaires de votre site ; ils sont généralement illisibles pour les humains et ne sont pas destinés à être vus par les visiteurs. Mais les robots d’exploration peuvent les utiliser pour s’assurer que tout est indexé.

Un exemple de Sitemap XML.
Un exemple de sitemap XML.

Ils fonctionnent en répertoriant simplement toutes les pages de votre site avec la hiérarchie de leurs liens, ainsi que les autres fichiers de votre site, tels que les images et les vidéos. Cela permet à Google de tout voir sur votre site et d’améliorer le SEO en conséquence.

Si vous avez utilisé un outil tel que Google Analytics ou Google Search Console, vous avez peut-être vu une option permettant de créer un lien vers votre sitemap. Google y fera référence en premier lorsqu’il enverra des robots d’exploration sur votre site.

La page d'accueil de Google Search Console.
La page d’accueil de Google Search Console.

Différences entre les sitemaps HTML et XML

Votre sitemap est donc une page HTML, mais quel est exactement le problème avec cela ? Pourquoi Google veut-il que vous la modifiiez ?

Les sitemaps doivent être rédigés dans un format particulier pour que les robots d’exploration les comprennent. La plupart du temps, il doit s’agir d’un fichier XML. Ils peuvent également lire un fichier RSS, Atom, KML ou texte, mais le XML est le choix le plus courant.

Un exemple de flux RSS.
Un exemple de flux RSS.

XML est l’abréviation de « Extensible Markup Language ». Il s’agit d’un langage web très similaire au HTML. La différence réside dans son utilisation : bien qu’il soit lisible par l’homme, sa fonction première est d’aider les machines à encoder des documents et à lire des données.

Dans ce cas, il s’agit d’aider un robot d’exploration à comprendre où se trouvent les pages et les autres médias de votre site et comment ils interagissent les uns avec les autres.

Mais vous avez peut-être déjà vu le terme « sitemap » utilisé dans un contexte très différent. Les plans de site HTML existent bel et bien, mais la grande différence est qu’ils sont conçus pour les humains, et non pour les robots.

Si vous avez déjà cliqué sur un lien vers la navigation d’un site et trouvé une liste des pages du site, lisible par l’homme et agréablement conçue, c’est ce qu’on appelle techniquement un plan de site. Mais si elle peut être utile à vos visiteurs, ce n’est pas ce que recherche Google.

Un sitemap XML ressemblera pour la plupart des utilisateurs à du code illisible ou à un mur massif de liens. Si vous souhaitez ajouter une page de navigation utile à votre site, n’hésitez pas à créer un plan de site HTML en parallèle… mais vous devez également créer un sitemap XML.

Un exemple de sitemap.
Un exemple de sitemap.

Autres types de sitemaps

Lorsque vous pensez à un sitemap, ce qui vous vient à l’esprit est peut-être une simple liste des pages de votre site. Mais Google utilise plusieurs types différents de plans de site pour cataloguer diverses informations. Il s’agit notamment de :

  • Vidéo : Les vidéos de votre site peuvent être spécialement indexées pour apparaître dans les résultats de Google Video.
  • Images : Il en va de même pour les images. Certaines images, telles que celles intégrées dans du code Javascript, peuvent ne pas être indexées de manière habituelle. Un sitemap d’images peut contribuer à faire apparaître votre site dans Google Images.
  • Nouvelles : Vous écrivez une chronique ? Google a une section spécialement dédiée aux actualités dans sa recherche. Un sitemap d’actualités peut vous permettre d’y apparaître correctement et d’obtenir plus de trafic.
  • Code : Google indexe les extraits de code pour aider les programmeurs à rechercher du code et des fichiers.
  • Données géographiques : Vous pouvez utiliser un sitemap KML spécial pour fournir à Google de meilleures données sur la localisation de votre entreprise.

Généralement, certaines de ces informations se trouvent dans votre plan de site principal. D’autres doivent avoir leur propre plan de site dédié. Et au final, elles doivent toutes être formatées de manière appropriée en XML ou dans un autre format pris en charge, et non en HTML.

Comment générer un Sitemap XML

Si vous avez intentionnellement soumis un lien vers un sitemap HTML, vous devrez le remplacer par un fichier XML. Si vous ne savez pas comment en créer un, il existe plusieurs façons de le faire avec des extensions WordPress et des générateurs que vous pouvez trouver en ligne.

Même si vous disposez d’un sitemap XML qui ne fonctionne pas, la régénération ou la soumission d’un sitemap différent peut résoudre le problème.

Il existe deux façons simples d’obtenir un sitemap : utiliser une extension ou en générer un avec un plan de site.

Générer un sitemap avec une extension

Avec WordPress, le moyen le plus simple d’obtenir un sitemap mis à jour dynamiquement sur votre site web est de télécharger une extension. De cette façon, vous n’avez pas besoin de téléverser manuellement des fichiers sur votre serveur.

Il existe un certain nombre d’extensions qui permettent de générer un sitemap :

  • Yoast SEO : L’extension SEO la plus populaire est également livrée avec la génération d’un sitemap. Vous pouvez trouver les réglages sous SEO > Général > Fonctionnalités et Sitemaps XML.
  • RankMath : En plus d’un sitemap normal, cette extension SEO peut également générer un sitemap WooCommerce et un sitemap de géo-données KML. Allez dans RankMath > Réglages de plan de site.
  • XML Sitemaps : Comme son nom l’indique, XML Sitemaps permet de générer un sitemap. Cette extension est 100 % gratuite et open source, il n’y a donc pas de frais cachés.
  • Sitemap XML &t Google News : Cette extension génère un sitemap XML et un sitemap Google News. Elle est également facile à installer et à configurer.
  • Companion Sitemap Generator – HTML & XML : Si vous souhaitez générer un sitemap HTML en plus d’un sitemap XML, cette extension est faite pour vous. Les deux sont automatiquement mis à jour, vous n’avez donc pas besoin de faire un travail manuel.

Sites générateurs de Sitemap

Au lieu d’une extension, vous pouvez utiliser un générateur de sitemap tel que XML-Sitemaps ou XML Sitemap Generator. Vous pouvez ensuite le téléverser sur votre site.

Étape 1 : Générez un sitemap en utilisant l’un des sites ci-dessus ou tout autre générateur de votre choix. Téléchargez le document XML.

Générateur XML-Sitemap
Générateur XML-Sitemap

Étape 2 : Téléchargez FileZilla ou (si cela est possible) utilisez votre hébergeur pour vous connecter à votre site via FTP.

Étape 3 : Placez le fichier XML dans le répertoire racine de votre site. La racine est le répertoire le plus élevé de votre site – le même répertoire que celui dans lequel vous démarrez lorsque vous vous connectez pour la première fois.

Comment corriger l’erreur de sitemap

L’erreur de sitemap est souvent causée par la soumission accidentelle d’une page HTML plutôt que d’un fichier XML correctement formaté. Mais si votre sitemap XML prétend toujours être une page HTML, vous avez peut-être un problème plus profond.

Pas d’inquiétude : le problème vient généralement d’un conflit facile à résoudre dans vos extensions WordPress. Voici quelques suggestions pour que votre sitemap fonctionne à nouveau correctement.

Vérifier les erreurs et les redirections

Il est beaucoup plus facile de diagnostiquer le problème si vous avez un code d’erreur explicite à rechercher. La première chose à faire est de parcourir la page de votre sitemap et de voir s’il y a des codes d’erreur étranges.

La page d'erreur 404 de Kinsta.
La page d’erreur 404 de Kinsta.

Si vous remarquez une erreur lorsque vous consultez votre sitemap, Google pense qu’il voit une page HTML. Utilisez cette erreur pour vous aider dans votre recherche afin de résoudre le problème. Notre liste des codes d’état HTTP peut vous aider.

Que faire si vous remarquez l’erreur de sitemap par intermittence ? Cela peut se produire si vous générez un sitemap de manière dynamique.

Les petits problèmes de serveur et les délais d’attente donneront à Google l’impression que votre sitemap est soudainement une page HTML, car il affiche un message d’erreur plutôt qu’un fichier XML. Tant que l’erreur est rare et qu’elle n’est pas permanente ou fréquente, il n’y a généralement pas lieu de s’inquiéter.

Il faut également faire attention aux redirections. Si vous parcourez votre page de sitemap et que vous vous retrouvez soudainement sur la page d’accueil ou dans une boucle de redirection infinie, cela peut également entraîner des problèmes.

Si vous trouvez des erreurs ou des redirections qui ne disparaissent pas, le problème réside généralement dans un conflit d’extension. Les extensions qui génèrent des sitemaps, comme Yoast, peuvent provoquer un conflit, ou une extension de mise en cache peut être à l’origine du problème.

Mais parfois, même des extensions apparemment aléatoires peuvent provoquer des conflits. Utilisez l’extension Health Check & Troubleshooting.

L’extension Health Check & Troubleshooting après l'installation.
L’extension Health Check & Troubleshooting après l’installation.

Installez-la si elle n’est pas déjà présente, puis allez dans Outils > Santé du site > Mode dépannage. Cela désactivera temporairement toutes les extensions sans affecter vos visiteurs.

Vérifiez si l’erreur ou la redirection a maintenant disparu sur votre site. Si c’est le cas, réactivez les extensions une par une jusqu’à ce que le site soit à nouveau en panne. Recherchez les conflits entre plusieurs extensions.

Vous pouvez désormais contacter le ou les auteurs de l’extension pour signaler le bogue et demander de l’aide.

Désactiver la mise en cache

L’une des principales causes de conflits est liée aux extensions de mise en cache. Lorsqu’un sitemap est mis en cache, il peut arriver que Google le lise comme une page HTML, car il ne faut pas mettre en cache les fichiers XML de cette façon.

La plupart des extensions de mise en cache évitent de mettre en cache une page de sitemap pour cette raison, mais ils peuvent quand même le faire par erreur, surtout si vous utilisez une URL unique pour votre sitemap.

Heureusement, vous n’avez pas besoin de désactiver l’ensemble de l’extension de mise en cache. Vous pouvez ajouter une exception, et le problème devrait se résoudre automatiquement.

La documentation de votre extension devrait couvrir ce point, mais voici comment le faire dans WP Super Cache et W3 Total Cache.

Pour WP Super Cache, allez dans Réglages > WP Super Cache. Sous l’onglet Avancé, faites défiler jusqu’à Ajouter des chaînes ici (pas un nom de fichier) qui forcent une page à ne pas être mise en cache.

Dans cette section, saisissez l’URL partielle de votre sitemap. Par exemple, si votre plan du site se trouve à l’adresse « site-exemple.com/sitemap.xml », saisissez « /sitemap.xml ».

Pour W3 Total Cache, rendez-vous dans Performance > Page Cache, puis trouvez Avancé > Ne jamais mettre en cache les pages suivantes. Comme pour WP Super Cache, saisissez l’URL du sitemap.

Vous pouvez également l’ajouter à la minification sous Performance > Minifier et Ne jamais minifier les pages suivantes, car cela peut entraîner des problèmes.

Vérifiez l’URL de votre sitemap

Bien qu’il s’agisse d’une petite suggestion, il est toujours utile de vérifier : Avez-vous soumis le bon lien ? C’est une erreur élémentaire à commettre, et même un seul caractère incorrect renverra au mauvais endroit.

Vérifiez le lien que vous avez soumis, à la fois via Google et dans toute extension de SEO ou de sitemap.

Certaines extensions peuvent ajouter une barre oblique à la fin de votre page de sitemap (« site-exemple.com/sitemap/ » au lieu de « site-exemple.com/sitemap »). Ce seul caractère peut entraîner d’énormes problèmes, surtout s’il provoque une boucle de redirection.

Encore une fois, activez le mode de dépannage dans l’extension Health Check et essayez de trouver quelle extension est à l’origine de ce problème. Dans la plupart des cas, vous pouvez remonter jusqu’à une seule extension.

Supprimer les sitemaps supplémentaires

Bien que cela ne pose généralement pas de problème tant que vous établissez un lien vers la bonne page, le fait d’avoir des sitemaps supplémentaires actifs peut occasionnellement causer des problèmes ou de la confusion pour vous. De plus, votre serveur dépense des ressources supplémentaires pour mettre à jour plusieurs sitemaps inutiles.

Les extensions peuvent ajouter différents sitemaps, et vous ne savez peut-être pas que WordPress génère même le sien pour vous. Vous devez les vérifier et les supprimer, sauf celui que vous souhaitez utiliser. Voici quelques URL que vous pouvez essayer sur votre site :

  • /sitemap.xml – Un choix courant pour les sitemaps générés par la plupart des extensions de sitemap.
  • /wp-sitemap.xml – Il s’agit du sitemap par défaut généré par WordPress depuis la version 5.5.
  • /sitemap_index.xml – L’URL du sitemap générée par Yoast.

Et si vous avez téléchargé d’autres extensions de SEO ou de sitemap, il se peut qu’elles utilisent une URL totalement différente. Vérifiez la documentation et assurez-vous de désactiver toute fonctionnalité de sitemap dont vous ne voulez pas.

Avez-vous vraiment besoin d’un sitemap?

Parfois, les sitemaps peuvent être inexplicablement la source d’un flux constant de problèmes. Et une simple correction peut ne pas suffire à les faire disparaître. Si vous rencontrez constamment des problèmes difficiles à résoudre, vous pouvez commencer à vous demander si un sitemap est vital pour vous.

Il est généralement encouragé de créer un sitemap, car Google affirme lui-même qu’il ne pénalisera jamais votre SEO en le faisant. Cela ne peut qu’aider à améliorer votre référencement et à faire indexer votre site plus rapidement.

Mais il n’est pas obligatoire d’en avoir un dans certaines situations, et Google lui-même suggère que certains sites ne les utilisent pas.

Supposons que votre site compte moins de 500 pages et qu’il est peu probable qu’il en ait jamais plus. Dans ce cas, tant que les liens sont bien faits en interne (ce que vous devriez faire de toute façon) et qu’il ne contient pas beaucoup de fichiers multimédias que vous souhaitez voir apparaître dans Google Images et Google Video, vous n’avez peut-être pas besoin du tout de sitemap.

D’un autre côté, le fait de disposer d’un sitemap peut réellement contribuer à votre SEO, et il n’y a aucun mal à en avoir un, de sorte que le fait d’aller jusqu’au bout et de régler le problème ne peut être que bénéfique. Votre site est peut-être petit maintenant, mais il ne le sera probablement pas toujours.

Si vous êtes bloqué, vous pouvez toujours vous tourner vers le support de votre hébergeur pour trouver la cause du problème.

Résumé

L’erreur « sitemap appears to be an HTML page » peut être ennuyeuse à identifier, mais elle est généralement le résultat d’une page mal formatée ou d’un conflit de mise en cache facile à résoudre. Une fois que vous avez identifié le problème, il suffit de suivre quelques étapes supplémentaires pour le résoudre.

Une erreur en entraîne souvent une autre, alors si vous avez toujours des problèmes avec votre site, consultez notre article principal sur les plus de 65 erreurs de WordPress et la façon de les corriger.

Salman Ravoof

Salman Ravoof is a self-taught web developer, writer, creator, and a huge admirer of Free and Open Source Software (FOSS). Besides tech, he's excited by science, philosophy, photography, arts, cats, and food. Learn more about him on his website, and connect with Salman on Twitter.