Les robots d’exploration de Google recherchent constamment sur Internet des pages web nouvelles et mises à jour.
Lorsque ces robots indexent le contenu d’un site, ils ne se contentent pas d’utiliser les informations pour fournir des résultats de recherche. Ils font une sauvegarde des pages et les ajoutent à une base de données unifiée appelée le cache Google.
Vous avez peut-être déjà utilisé le cache Google pour afficher d’anciennes versions de sites web qui sont hors service ou qui ne se chargent pas correctement. Mais savez-vous que vous pouvez aussi l’utiliser pour résoudre des problèmes sur votre site web ? Il peut même vous aider dans vos efforts de SEO.
Cet article présente le cache Google et comment le vérifier. Nous verrons également en quoi le cache Google est utile – et quand vous ne devez pas trop vous y fier.
Qu’est-ce que le cache Google ?
Une page cache Google est une sauvegarde HTML brute du contenu d’une page prise pendant l’une des analyses de Google. L’ensemble du cache Google comprend ces pages sauvegardées.
Si vous regardez la version en cache de votre site web, elle ressemblera probablement beaucoup à ce qu’était le site au moment de l’exploration. Mais il y a quelques raisons pour lesquelles il apparaît parfois différemment de ce à quoi vous vous attendez.
Les deux principales raisons sont les suivantes :
- La page web est rendue par votre navigateur, pas par Google. Cela peut entraîner des divergences avec la version actuelle du site.
- JavaScript n’est pas enregistré dans le cache, donc certaines parties de votre site web peuvent manquer.
En haut d’une page mise en cache, vous verrez une bannière vous indiquant trois choses :
- L’URL de la page mise en cache – Il s’agit généralement de l’URL que vous vouliez visiter. Dans certains cas, comme une URL redirigée, elle sera différente.
- La date à laquelle cette version de la page a été mise en cache – Vous pouvez voir si la page en cache que vous consultez a été créée hier ou la semaine dernière. Ce n’est pas nécessairement la dernière fois que votre page web a été explorée; nous y reviendrons dans un instant.
- Versions – Vous pouvez choisir d’afficher la version complète, la version texte seulement ou la source de votre page. La version complète vous montre la page telle qu’elle est rendue par votre navigateur. Dans la version texte seul, les CSS sont désactivés et aucune image n’est affichée, mais vous verrez toujours les liens hypertextes. En cliquant sur Afficher la source , vous pouvez voir le code source de la page :
Pourquoi le cache Google est important
L’utilisation principale du cache Google est pour les personnes qui naviguent sur Internet. Il leur permet de voir les pages web qui sont en panne ou qui ont des problèmes de chargement.
En tant que propriétaire de site web, il y a d’autres raisons pour lesquelles le cache Google est crucial. Vous espérez que votre site ne tombera jamais en panne ou n’aura pas de pépins, mais cela arrive. Avoir un cache permet de mettre votre contenu à la disposition des utilisateurs, même si quelque chose ne fonctionne pas correctement.
Vous pouvez aussi utiliser la version en cache de votre site pour savoir comment votre site est indexé et diagnostiquer les problèmes. Lisez la suite pour en savoir plus.
Comment voir le cache Google
La façon dont vous vous y prenez pour accéder à une page Google en cache à partir des résultats du moteur de recherche Google dépend du type d’appareil que vous utilisez. Depuis un navigateur web de bureau, vous avez deux options :
- Vous pouvez suivre un lien vers la version en cache d’une page à partir des résultats de la recherche Google.
- Vous pouvez aller directement à la page.
Sur les navigateurs mobiles, vous avez uniquement la possibilité d’utiliser l’URL directe.
Voir une page en cache à partir des résultats de recherche Google
Même si vous avez de l’expérience dans l’affichage de sites en cache à partir de la page de résultats de recherche, vous devriez lire ceci car Google a changé la façon de trouver un lien en cache au début de 2021.
Pour commencer, cherchez la page que vous voulez voir sur Google. À côté de l’URL de la page dans les résultats de recherche, vous devriez voir trois points verticaux. Cliquez dessus, et une fenêtre contextuelle devrait apparaître, intitulée « À propos de ce résultat » :
Cette fonctionnalité est actuellement en version bêta. Elle a pour but de vous permettre d’en savoir plus sur un site (comme s’il est sûr) avant de cliquer.
En bas à droite de la fenêtre popup, il y a un bouton intitulé En cache. Cliquez dessus pour voir la page en cache.
Dans certains cas, il se peut que vous ne voyez pas de bouton En cache . Cela peut signifier que la page n’a pas été mise en cache ; nous parlerons de ce que cela signifie dans un instant.
Mais si vous êtes sur mobile, vous ne verrez le bouton pour aucune page. Dans ce cas, continuez à lire pour apprendre l’autre méthode pour afficher une page en cache.
Modifier l’URL pour afficher la page en cache
Pour cette méthode, vous devez connaître l’URL de la page que vous voulez voir. Il suffit de saisir cache:website.xyz
dans la barre de recherche.
Par exemple, cache:kinsta.com
vous amènera directement à notre page d’accueil mise en cache.
Autres outils pour afficher le cache de Google
Vous n’avez pas besoin d’outils spéciaux pour afficher les pages mises en cache ; Google le fait de manière native et extrêmement facile. Mais il existe quelques outils dont les fonctionnalités pourraient vous plaire.
L’extension Web Cache Viewer pour Chrome vous permet de cliquer avec le bouton droit de la souris sur n’importe quel lien pour voir à la fois la version du cache Google et la version de l’archive web Wayback Machine de la page.
Et Google Cache Checker de Small SEO Tools vous permet de voir les URL et les dates mises en cache pour un maximum de cinq pages à la fois :
Voir des anciennes versions d’une page avec le cache Google
Votre page indique qu’elle a été mise en cache hier, mais vous voulez voir la version de la semaine dernière. Est-ce possible avec le cache Google ?
Malheureusement, non.
Google ne peut vous montrer qu’une seule version d’une page mise en cache. Pour voir les versions précédentes d’un site web, vous pouvez utiliser un outil comme Wayback Machine, une archive des versions antérieures des pages web.
Regardez à quoi nous ressemblions avant !
Raisons d’utiliser le cache Google en tant que propriétaire de site web
La vérité est qu’il existe d’autres outils pour accomplir tout ce qui est décrit ci-dessous – dans de nombreux cas, des outils plus sophistiqués.
Mais le cache Google est difficile à battre car il est rapide et facile à vérifier. Cela en fait un moyen précieux de surveiller certains aspects de vos pages web.
Voici cinq façons dont vous pouvez utiliser le cache Google en tant que propriétaire de site.
1. Vérifier le contenu dupliqué
Parfois, vous cliquez sur un lien en cache et vous atterrissez sur une page différente de celle que vous attendiez.
L’une des raisons pour lesquelles cela peut se produire est due au contenu dupliqué. Lorsque Google voit deux pages très similaires, il peut décider de ne pas les garder séparément dans l’index. Il en résulte qu’une seule est conservée dans le cache.
Google mettant en cache plusieurs pages sous le même lien peut vous avertir que vous avez du contenu dupliqué sur votre site. Le contenu dupliqué ne crée pas seulement une situation confuse dans le cache – il est mauvais pour le SEO.
Profitez de l’occasion pour examiner les deux pages et trouver un moyen de les différencier.
2. Vérifier que Google respecte vos balises canoniques
Peut-être que le contenu dupliqué de votre site web est intentionnel, mais que vous avez ajouté des balises rel=canonical
pour indiquer à Google la version à analyser.
Vérifiez la version de Google Cache de l’une des pages que vous ne voulez pas faire analyser. Vous devriez être dirigé vers un cache de la page canonique.
3. Vous assurer que vos efforts de marketing ont été analysés
Vous avez intensifié vos efforts de référencement ou de production de contenu, et vous voulez vous assurer que Google indexe les changements.
Un coup d’œil rapide à la version en cache d’une page peut vous indiquer qu’elle a été analysée.
Notez que si vos modifications ne sont pas apparues sur la page mise en cache, elles ont peut-être quand même été indexées. Si vous êtes inquiet, vous pouvez vous rendre dans l’inspecteur d’URL de Google Search Console pour confirmer. Mais si vous voyez vos mises à jour sur le cache, vous savez qu’elles ont été indexées et qu’elles commenceront à avoir un impact sur le classement de vos résultats de recherche.
4. Garder un œil sur les modifications apportées aux sites concurrents
Vous vous occupez de vos affaires, profitant de votre position en tête des résultats de recherche pour un mot-clé essentiel, lorsqu’un concurrent prend votre place sans crier gare. Qu’ont-ils fait pour y arriver ? Vous pouvez utiliser le cache Google pour le découvrir. Comparez leurs pages en cache aux versions actuelles – vous pourrez voir quelles modifications récentes le concurrent a apportées.
5. Récupérer une version récente de votre site
Vous devriez toujours avoir une sauvegarde de votre site web au cas où quelque chose lui arriverait. Cela dit, le pire peut parfois arriver, même pour la personne la mieux préparée.
Bien que la version du cache Google de votre site ne remplace pas une sauvegarde complète, elle vous permet parfois de voir à quoi ressemblaient vos pages avant le désastre. Vous pouvez l’utiliser pour récupérer l’ancien contenu ou le code qui a été perdu.
Limites du cache Google
Le cache Google peut fournir des informations utiles, et cela peut valoir la peine de l’examiner si quelque chose semble étrange. Mais le cache Google a quelques limites connues.
Le cache Google ne vous dira pas quand votre page a été analysée pour la dernière fois
Commençons par l’une des plus grandes idées fausses.
Beaucoup de gens croient que le cache est mis à jour chaque fois qu’un robot Google analyse une page. De nombreux autres articles sur ce sujet vous diront d’utiliser le cache pour voir à quelle fréquence votre page est analysée.
Ce n’est pas vrai.
Nous le savons parce que John Mueller de Google nous l’a dit lui-même dans un fil d’aide, en disant :
« En général, nous ne mettons pas toujours à jour la page en cache chaque fois que nous analysons une page. En particulier lorsque la page ne change pas de manière significative, nous pouvons choisir de simplement garder [sic] l’ancienne date dessus. »
Voici un conseil de pro : Si vous cherchez des informations sur la fréquence, la raison et les robots avec lesquels Google analyse votre site web, oubliez le cache. Ces données se trouvent sur Google Search Console. Vous pouvez trouver le rapport d’analyse sous Paramètres dans la colonne latérale.
Cependant, vous ne pouvez voir ces informations qu’au niveau du domaine. Search Console ne vous dira pas à quelle fréquence chaque page est analysée.
La page peut ne pas être rendue correctement
Heureusement, des progrès ont été réalisés sur ce front. Le service de rendu web de Google, qui rend les pages en direct sur le web, était autrefois basé sur une version obsolète de Chrome. Par conséquent, les navigateurs à jour rendaient parfois une page mise en cache différemment de la page actuelle rendue par Google.
Depuis 2019, le service de rendu web de Google utilise la dernière version de Chrome. Cependant, si votre version de Chrome est ancienne, ou si vous utilisez un autre navigateur, la page mise en cache peut être rendue de manière incorrecte.
Un autre problème de rendu est lié aux ressources manquantes. Le code que Google sauvegarde peut faire référence à une ressource comme CSS ou JavaScript. Si ces ressources n’existent plus ou ont été modifiées, la page ne s’affichera pas correctement.
La mauvaise page est affichée
Nous avons déjà vu comment le contenu dupliqué ou les balises canoniques incorrectes peuvent amener le cache Google à afficher la mauvaise page. Comme vous pouvez l’imaginer, cela limite l’utilité de consulter le cache pour des pages web spécifiques.
Certaines pages ne sont pas mises en cache
Cela peut vous surprendre, mais il s’avère que de nombreuses pages ne sont pas du tout mises en cache.
Une idée fausse très répandue est qu’un site web non mis en cache signifie que Google ne l’a pas jugé essentiel, mais ce n’est pas forcément vrai. Nous allons maintenant examiner les raisons pour lesquelles une page peut ne pas être mise en cache.
Pourquoi ne puis-je pas trouver ma page web mise en cache ?
Toutes les pages qui sont analysées ne sont pas mises en cache. Si votre page n’a pas de version en cache, ne paniquez pas ! Cela ne signifie pas que votre page n’a pas été indexée.
Si tu craignez qu’elle n’ait vraiment pas été indexée, vous pouvez utiliser l’Inspecteur d’URL de Google Search Console pour vérifier.
Pour avoir la preuve que les pages indexées ne sont pas toujours mises en cache, nous retournons voir John Mueller de Google. Sur Twitter, il a répondu à un utilisateur qui posait des questions sur une page non mise en cache :
« Nous ne mettons pas en cache toutes les pages que nous indexons, donc cela peut arriver. Parfois, cela prend un certain temps, parfois nous ne la mettons pas du tout en cache. »
Et lorsque l’utilisateur lui a demandé si les sites non mis en cache étaient toujours de mauvaise qualité, il a répondu :
« Ça peut être toutes sortes de pages pour des bizarreries techniques. Le cache est en quelque sorte séparé, donc il n’est pas indicatif de ce que nous indexons et classons. »
En d’autres termes, les pages en cache ne sont pas un facteur de classement. Vous pouvez arriver en tête des résultats de recherche même si vos pages web n’ont pas de version en cache.
Mais une page non mise en cache peut quand même valoir la peine d’être examinée. Il y a quelques possibilités différentes que vous pouvez explorer.
Votre page est basée sur JavaScript
Google a plus de facilité à indexer certaines pages basées sur JavaScript que d’autres. Mais de nombreuses pages JavaScript finissent par être mises en cache ou même non indexées.
C’est parce que la plupart du HTML n’est pas chargé avant l’exécution de JavaScript. S’il n’y a rien à indexer, Google ne créera pas de page mise en cache.
La mise en cache est empêchée par une balise méta
Une balise méta noindex
dans le code HTML de votre page signifie que la page ne peut pas être indexée par Google, tandis que noarchive
l’empêche d’être mise en cache. Dans les deux cas, la page ne sera pas mise en cache.
C’est peut-être précisément ce que vous voulez. Mais si vous n’avez pas réalisé que vous aviez une balise noindex
ou noarchive
sur la page, la supprimer peut résoudre votre problème de cache manquant.
La page est dupliquée (ou Google pense que c’est le cas)
Si Google a décidé que deux de vos pages sont des doublons, trouvez des moyens de les rendre uniques. Prenez en compte les différentes intentions de recherche pour chaque page.
Comment résoudre les problèmes liés aux pages mises en cache de votre site web
Votre page n’est pas obligée d’être mise en cache, mais si vous voulez que cela se produise, il y a certaines choses que vous pouvez faire.
Soumettez votre page à Google
Si vous vous inquiétez du fait que Google n’a pas du tout indexé votre page, vous pouvez consulter Google Search Console.
Saisissez l’URL de la page dans la barre de recherche d’ inspection d’URL en haut de Search Console. Si vous obtenez le résultat « L’URL est sur Google », la page a été indexée. Si la page a été modifiée récemment et que vous pensez que Google n’a pas indexé la nouvelle version, vous pouvez cliquer sur Demander l’indexation pour demander à Google de l’indexer à nouveau.
Vous pouvez aussi obtenir le résultat « La page n’est pas sur Google ». « Si c’est le cas, faîtes défiler la page vers le bas et vous pourrez voir quelques détails sur la page. Par exemple, vous pouvez vérifier si l’analyse est autorisée sur cette page et si le canonique choisi par l’utilisateur correspond au canonique choisi par Google. Pour demander l’indexation, cliquez sur Demander l’indexation:
Vérifiez les problèmes courants du site
Nous avons déjà abordé plusieurs raisons pour lesquelles vos pages pourraient ne pas être mises en cache, comme un JavaScript étendu et du contenu dupliqué.
Au-delà de cela, la meilleure chose que vous puissiez faire pour encourager une indexation fréquente est de créer un site de haute qualité. Assurez-vous que vous avez optimisé votre site pour le mobile et que la vitesse de votre site est élevée.
Si le temps de chargement de vos pages est trop lent, cela peut même ralentir les robots de Google, ce qui entraîne un retard d’indexation.
Comment supprimer des pages du cache Google
Nous pensons que le cache Google est très utile, mais vous ne voulez peut-être pas qu’une ancienne version de votre page web soit stockée sur les serveurs de Google pour diverses raisons. Par exemple, vous ne souhaitez peut-être pas que les pages des produits abandonnés soient disponibles.
Une façon d’empêcher la mise en cache de vos pages est d’utiliser les balises noindex
et noarchive
mentionnées ci-dessus. Ces balises sont la solution permanente idéale si vous voulez conserver les pages mais ne voulez jamais qu’elles soient mises en cache.
Vous pouvez aussi demander directement à Google de supprimer les URL du cache Google. Pour cela, allez dans Google Search Console et cliquez sur Suppression dans la colonne latérale. Puis cliquez sur Nouvelle demande. À ce stade, vous avez deux options : Supprimer temporairement l’URL et Effacer l’URL en cache.
La suppression temporaire signifie que l’URL n’apparaîtra pas dans les résultats de recherche Google pendant environ six mois. Le cache disparaîtra également. La page sera réindexée et remise en cache lorsqu’elle sera à nouveau en ligne (si vous ne voulez pas que cela se produise, vous devrez ajouter une balise méta).
Effacer l’URL en cache est exactement ce à quoi cela ressemble. Le cache sera supprimé, mais la page sera à nouveau mise en cache lorsque le site sera analysé.
Si vous voulez que l’ancienne version d’une page mise à jour disparaisse, c’est un excellent moyen de le faire. Vous pouvez aussi pousser Google à mettre à jour le cache de votre page en soumettant la page à l’indexation après l’avoir modifiée.
Résumé
Le cache Google n’est pas tout ce que l’on dit de lui. Vous ne pouvez pas l’utiliser pour vérifier quand votre site web a été analysé pour la dernière fois – le fait de l’avoir n’améliore pas votre classement dans les moteurs de recherche. Et parfois, la version stockée de votre site est bizarre, incomplète ou tout simplement fausse.
Mais le cache Google a son utilité pour les propriétaires de sites web. C’est un moyen rapide de vérifier comment votre site a été indexé, et cela peut vous aider à remarquer et à diagnostiquer les problèmes. Vous pouvez aussi utiliser Google Search Console pour améliorer votre classement dans les moteurs de recherche.
Vous avez encore des questions sur le cache Google ? Faîtes-nous en part dans la section des commentaires – nous voulons les entendre !
Laisser un commentaire