De webcrawlers van Google zoeken constant op internet naar nieuwe en bijgewerkte webpagina’s.
Wanneer deze crawlers de content van een site indexeren, gebruiken ze de informatie niet alleen om zoekresultaten te leveren. Ze maken namelijk ook een backup van de pagina’s en voegen ze toe aan een uniforme database genaamd Google Cache.
Mogelijk heb je Google Cache gebruikt om oude versies van websites te bekijken die niet beschikbaar zijn of niet correct worden geladen. Maar wist je dat je het ook kunt gebruiken om problemen op je website op te lossen? Het kan zelfs helpen bij je SEO strategie.
Dit artikel introduceert Google Cache en hoe je dit kunt checken. We zullen ook bekijken hoe Google Cache nuttig is – en wanneer je er niet te veel op moet vertrouwen.
Wat is Google Cache?
Een gecachete pagina van Google is een onbewerkte HTML backup van de content op een pagina die is gemaakt tijdens een van Google’s crawls. Google Cache als geheel omvat deze gebackupte pagina’s.
Als je naar de gecachete versie van je website kijkt, ziet deze er waarschijnlijk net zo uit als de site toen deze werd gecrawld. Maar er zijn een paar redenen waarom het soms anders lijkt dan je verwacht.
Twee hoofdredenen zijn:
- De webpagina wordt gerenderd door je browser, niet door Google. Dit kan afwijkingen veroorzaken met de huidige versie van de site.
- JavaScript wordt niet opgeslagen in de cache, dus er kunnen delen van je website ontbreken.
Boven aan een gecachete pagina zie je een banner met drie dingen:
- De URL van de gecachete pagina — Dit is meestal de URL die je wilde bezoeken. In sommige gevallen, zoals een omgeleide URL, zal het anders zijn.
- De datum waarop deze versie van de pagina is gecachet – Je kunt zien of de gecachete pagina die je bekijkt gisteren of vorige week is gemaakt. Dit is niet per se de laatste keer dat je webpagina is gecrawld; daar komen we zo op terug.
- Versies — Je kunt ervoor kiezen om de volledige versie, de tekstversie of de source van je pagina te bekijken. De volledige versie toont je de pagina zoals gerenderd door je browser. De versie met alleen tekst heeft CSS uitgeschakeld en er worden geen afbeeldingen weergegeven, maar je ziet nog steeds hyperlinks. Als je op View source klikt, wordt de broncode van de pagina weergegeven:
Waarom is Google Cache belangrijk?
Het primaire gebruik van Google Cache is voor mensen die op het internet surfen. Hiermee kunnen ze webpagina’s zien die niet beschikbaar zijn of problemen hebben met laden.
Als website-eigenaar zijn er nog andere redenen waarom Google Cache cruciaal is. Je hoopt dat je site nooit uitvalt of storingen vertoont, maar het kan gebeuren. Met een cache is je content beschikbaar voor gebruikers, zelfs als er iets niet goed werkt.
Je kunt ook de gecachete versie van je site gebruiken om meer te weten te komen over hoe je site is geïndexeerd en om problemen op te sporen. Lees verder voor meer informatie.
Zo bekijk je Google Cache
Hoe je vanuit de zoekresultaten van Google naar een gecachete Google pagina gaat, hangt af van het type apparaat dat je gebruikt. Vanuit een desktopwebbrowser heb je twee opties:
- Je kunt een link naar de gecachete versie van een pagina volgen vanuit de Google zoekresultaten.
- Je kunt direct naar de pagina gaan.
In mobiele browsers heb je alleen de mogelijkheid om de directe URL te gebruiken.
Een gecachete pagina bekijken vanuit Google zoekresultaten
Zelfs als je ervaring hebt met het bekijken van gecachete sites vanaf de zoekresultatenpagina, wil je dit misschien lezen omdat Google begin 2021 de manier heeft veranderd om een gecachete link te vinden.
Zoek om te beginnen naar de pagina die je op Google wilt zien. Naast de URL van de zoekresultatenpagina, zou je drie verticale stippen moeten zien. Klik erop en er zou een pop-upvenster moeten verschijnen met het label “About this result”:
Deze feature is momenteel in bèta. Het is bedoeld om je meer te leren over een site (zoals of deze veilig is) voordat je erop klikt.
Rechtsonder in de popup bevindt zich een knop met het label Cached. Klik erop om de gecachete pagina te zien.
In sommige gevallen zie je mogelijk geen Cached knop. Dat kan betekenen dat de pagina niet is gecachet; we zullen het zo meteen hebben over wat dat betekent.
Maar als je op je mobiel bent, zie je de knop voor geen enkele pagina. Blijf in dat geval lezen om de andere methode te leren om een gecachete pagina te bekijken.
De URL wijzigen om de gecachete pagina te bekijken
Voor deze methode moet je de URL weten van de pagina die je wilt zien. Voer gewoon cache:website.xyz
in de zoekbalk in.
cache:kinsta.com
brengt je bijvoorbeeld rechtstreeks naar onze gecachete startpagina.
Andere tools voor het bekijken van Google Cache
Je hebt geen speciale tools nodig om gecachete pagina’s te bekijken; Google maakt het zeer eenvoudig. Maar er zijn een paar tools die er zijn met features die je misschien leuk vindt.
Met de Web Cache Viewer extensie voor Chrome kun je met de rechtermuisknop op een link klikken om zowel de Google Cache versie als de Wayback Machine webarchief versie van de pagina te zien.
En met de Google Cache Checker van Small SEO Tools kun je de URL’s en datums waarop er is gecachet bekijken voor maximaal vijf pagina’s:
Oudere versies van een pagina bekijken met Google Cache
Je pagina zegt dat deze gisteren is gecachet, maar je wilt de versie van vorige week zien. Is het mogelijk met Google Cache?
Helaas niet.
Google kan je slechts één versie van een gecachete pagina laten zien. Om eerdere websiteversies te zien, kun je een tool gebruiken zoals de Wayback Machine, een archief van eerdere versies van webpagina’s.
Kijk eens hoe we er vroeger uitzagen!
Redenen om Google Cache te gebruiken als website-eigenaar
De waarheid is dat er andere tools beschikbaar zijn om alles hieronder te bereiken – in veel gevallen meer geavanceerde tools.
Maar Google Cache is moeilijk te verslaan omdat het snel en gemakkelijk te checken is. Dat maakt het een waardevolle manier om bepaalde aspecten van je webpagina’s te monitoren.
Hier zijn vijf manieren waarop je Google Cache kunt gebruiken als site-eigenaar.
1. Check op dubbele content
Soms klik je op een gecachete link en kom je op een andere pagina terecht dan je had verwacht.
Een reden waarom dit kan gebeuren, is vanwege dubbele content. Wanneer Google twee sterk op elkaar lijkende pagina’s ziet, kan het besluiten deze niet gescheiden te houden in de index. Dit resulteert in dat er maar één in de cache wordt bewaard.
Google die meerdere pagina’s onder dezelfde link cachet, kan je erop wijzen dat je dubbele content op je site hebt. Dubbele content creëert niet alleen een verwarrende cachesituatie – het is slecht voor SEO.
Maak van de gelegenheid gebruik om de twee pagina’s te bekijken en een manier te vinden om ze van elkaar te onderscheiden.
2. Controleer of Google je canonical tags respecteert
Misschien is de dubbele content op je website opzettelijk, maar je hebt rel=canonical
tags toegevoegd om Google te laten weten welke versie moet worden gecrawld.
Check de Google Cache versie van een van de pagina’s die je niet wilt laten crawlen. Je zou naar een cache van de canonical pagina moeten worden gebracht.
3. Zorg ervoor dat je marketinginspanningen zijn gecrawld
Je hebt je inspanningen op het gebied van SEO of contentproductie opgevoerd en je wilt er zeker van zijn dat Google de wijzigingen indexeert.
Een snelle blik op de gecachete versie van een pagina kan je vertellen dat deze is gecrawld.
Houd er rekening mee dat als je wijzigingen niet op de gecachete pagina zijn verschenen, ze mogelijk nog steeds zijn geïndexeerd. Als je je zorgen maakt, kun je naar de URL Inspector van Google Search Console gaan om te bevestigen. Maar als je je updates in de cache ziet, weet je dat ze zijn geïndexeerd en van invloed zullen zijn op je positie in de zoekresultaten.
4. Houd wijzigingen aan sites van concurrenten in de gaten
Je doet lekker je ding en geniet van je positie bovenaan de zoekresultaten voor een cruciaal zoekwoord… totdat ineens een concurrent je plek uit het niets overneemt. Wat hebben ze gedaan om daar te komen? Je kunt Google Cache gebruiken om erachter te komen. Vergelijk hun gecachete pagina’s met de huidige versies – je kunt zien welke recente wijzigingen de concurrent heeft aangebracht.
5. Haal een recente versie van je site op
Je moet altijd een backup van je website hebben voor het geval er iets mee gebeurt. Dat gezegd hebbende, soms kan het ergste gebeuren, zelfs met de best voorbereide persoon.
Hoewel de Google Cache versie van je site geen volledige backup vervangt, kun je soms wel zien hoe je pagina’s eruit zagen voordat het noodlot toesloeg. Je kunt het gebruiken om oude content of code op te halen die verloren is gegaan.
Beperkingen van Google Cache
De cache van Google kan nuttige informatie bieden en het kan de moeite waard zijn om te onderzoeken of iets er vreemd uitziet. Maar Google Cache heeft enkele bekende beperkingen.
Google Cache vertelt je niet wanneer je pagina voor het laatst is gecrawld
Laten we beginnen met een van de grootste misvattingen.
Veel mensen geloven dat de cache elke keer dat Googlebot een pagina crawlt, wordt bijgewerkt. Tal van andere artikelen over dit onderwerp vertellen je dat je de cache moet gebruiken om te zien hoe vaak je pagina wordt gecrawld.
Dat is niet waar.
We weten dat omdat John Mueller van Google ons dat zelf heeft verteld in een help thread en zei:
“Over het algemeen werken we de gecachete pagina niet altijd bij elke keer dat we een pagina crawlen. Vooral wanneer de pagina niet significant verandert, kunnen we ervoor kiezen om gewoon de oude datum erop te houden.”
Hier is een professionele tip: als je informatie zoekt over hoe vaak, waarom en met welke bots Google je website crawlt, vergeet dan de cache. Die gegevens staan op Google Search Console. Je vindt het crawlrapport onder Settings in de zijbalk.
Je kunt deze informatie echter alleen op domeinniveau zien. Search Console vertelt je niet hoe vaak elke pagina wordt gecrawld.
De pagina wordt mogelijk niet correct gerenderd
Gelukkig is er op dit front enige vooruitgang geboekt. De webrendering-service van Google, die live pagina’s op internet weergeeft, was vroeger gebaseerd op een verouderde versie van Chrome. Daarom renderen up-to-date browsers een gecachete pagina soms anders dan Google de huidige rendert.
Sinds 2019 gebruikt Google Web Rendering Service de nieuwste versie van Chrome.
Als je Chrome versie echter oud is of als je een andere browser gebruikt, kan de gecachete pagina onjuist worden gerenderd.
Een ander renderingprobleem heeft te maken met ontbrekende resources. De code waarvan Google een backup maakt, kan verwijzen naar een resource zoals CSS of JavaScript. Als die resources niet meer bestaan of zijn gewijzigd, wordt de pagina niet correct gerenderd.
De verkeerde pagina wordt weergegeven
We hebben al gekeken hoe dubbele content of onjuiste canonical tags ertoe kunnen leiden dat Google Cache de verkeerde pagina weergeeft. Zoals je je misschien kunt voorstellen, beperkt dit het nut van het kijken naar de cache voor specifieke webpagina’s.
Sommige pagina’s zijn niet gecachet
Dit kan als een verrassing komen, maar het blijkt dat veel pagina’s helemaal niet worden gecachet.
Een wijdverbreide misvatting is dat een niet-gecachete website betekent dat Google deze niet als essentieel heeft beschouwd, maar dat is niet per se waar. We zullen enkele redenen bekijken waarom een pagina mogelijk niet heeft gecachet.
Waarom kan ik mijn gecachete webpagina niet vinden?
Niet alle pagina’s die worden gecrawld, worden gecachet. Als je pagina geen gecachete versie heeft, raak dan niet in paniek! Het betekent niet dat je pagina niet is geïndexeerd.
Als je je zorgen maakt dat het echt niet is geïndexeerd, kun je de URL Inspector van Google Search Console gebruiken om dit te checken.
Als bewijs dat geïndexeerde pagina’s niet altijd in de cache worden opgeslagen, gaan we terug naar John Mueller van Google. Op Twitter reageerde hij op een gebruiker die vroeg naar een niet-gecachete pagina:
“We cachen niet alle pagina’s die we indexeren, dus dat kan gebeuren. Soms duurt het even, soms cachen we helemaal niet.”
En toen de gebruiker hem vroeg of ongecachete sites altijd van lage kwaliteit waren, zei hij:
“Dat + het kunnen allerlei pagina’s zijn voor rare technische eigenaardigheden. De cache is een beetje apart, dus het is niet indicatief voor wat we indexeren en positioneren.
Met andere woorden, gecachete pagina’s zijn geen positioneringsfactor. Je kunt bovenaan de zoekresultaten komen, zelfs als je webpagina’s geen gecachte versies hebben.
Maar een ongecachete pagina, is misschien nog steeds de moeite waard om te bekijken. Er zijn een paar verschillende mogelijkheden die je kunt verkennen.
Je pagina is gebaseerd op JavaScript
Google heeft het gemakkelijker om sommige pagina’s met JavaScript te indexeren dan andere. Maar veel JavaScript pagina’s worden niet gecachet of zelfs niet geïndexeerd.
Dat komt omdat de meeste HTML pas wordt geladen nadat JavaScript is uitgevoerd. Als er niets is om te indexeren, zal Google geen gecachete pagina maken.
Caching wordt voorkomen door een metatag
Een noindex
metatag in de HTML code van je pagina betekent dat de pagina niet kan worden geïndexeerd door Google, terwijl noarchive
voorkomt dat het gecachet wordt. Een van beide resulteert in een niet-gecachete pagina.
Misschien is dat precies wat je wilt. Maar als je je niet realiseerde dat je een noindex
of noarchive
tag op de pagina had, kan het verwijderen ervan je ontbrekende cacheprobleem oplossen.
De pagina is een duplicaat (of Google denkt dat)
Als Google heeft besloten dat twee van je pagina’s duplicaten zijn, zoek je naar manieren om ze uniek te maken. Houd rekening met de verschillende zoekintenties voor elke pagina.
Zo los je problemen met de gecachete pagina’s van je website op.
Je pagina hoeft niet te worden gecachet, maar als je wel wilt dat dit gebeurt, zijn er enkele dingen die je kunt doen.
Dien je pagina in bij Google
Als je je zorgen maakt dat Google je pagina helemaal niet heeft geïndexeerd, kun je Google Search Console checken.
Voer de URL van de pagina in de zoekbalk voor URL inspectie boven aan Search Console in. Als je het resultaat ‘URL is on Google’ krijgt, is de pagina geïndexeerd. Als de pagina onlangs is gewijzigd en je denkt dat Google de nieuwe versie niet heeft geïndexeerd, kun je klikken op Request Indexing om Google te vragen deze opnieuw te indexeren.
Mogelijk krijgt je ook het resultaat “Page is not on Google.” Als je dat doet, scrol je naar beneden en zie je enkele details over de pagina. Je kunt bijvoorbeeld controleren of crawlen op die pagina is toegestaan en of de door de gebruiker gekozen canonieke versie overeenkomt met de door Google gekozen canonieke versie. Om indexering aan te vragen, klik op Request Indexing:
Checken op veelvoorkomende siteproblemen
We hebben al verschillende redenen behandeld waarom je pagina’s mogelijk niet zijn gecachet, zoals uitgebreid JavaScript en dubbele content.
Verder kun je het beste een site van hoge kwaliteit maken om frequent indexeren aan te moedigen. Zorg ervoor dat je je website voor mobiel hebt geoptimaliseerd en dat de snelheid van je site hoog is.
Als de laadtijd van je pagina te traag is, kan dit de bots van Google vertragen, wat kan leiden tot vertraagde indexering.
Zo verwijder je pagina’s uit Google Cache
We denken dat Google Cache best handig is, maar om verschillende redenen wil je misschien niet dat een oude versie van je webpagina op de servers van Google wordt opgeslagen. Misschien wil je bijvoorbeeld niet dat pagina’s voor beëindigde producten beschikbaar zijn.
Een manier om het cachen van je pagina’s te voorkomen is met noindex
en noarchive
tags zoals hierboven vermeld. Deze tags zijn de ideale permanente oplossing als je de pagina’s wilt behouden, maar nooit wilt dat ze gecachet worden.
Je kunt Google ook rechtstreeks vragen om URL’s uit Google Cache te verwijderen. Ga hiervoor naar Google Search Console en klik op Removals in de zijbalk. Klik vervolgens op New Request. Op dit moment heb je twee opties: Temporarily Remove URL en Clear Cached URL.
Tijdelijke verwijdering betekent dat de URL ongeveer zes maanden niet wordt weergegeven in de zoekresultaten van Google. De cache zal ook verdwijnen. De pagina wordt opnieuw geïndexeerd en opnieuw gecachet wanneer deze weer live is (als je niet wilt dat dit gebeurt, moet je een metatag toevoegen).
Het wissen van de gecachete URL is precies hoe het klinkt. De cache wordt verwijderd, maar de pagina wordt weer gecachet wanneer de site wordt gecrawld.
Als je wilt dat een oude versie van een bijgewerkte pagina verdwijnt, is dit een uitstekende manier om dit te doen. Je kunt Google ook pushen om de cache van je pagina bij te werken door de pagina in te dienen voor indexering nadat je deze hebt gewijzigd.
Samenvatting
Over Google Cache gaan de wildste geruchtende ronde en veel daarvan zijn niet waar. Je kunt het niet gebruiken om te checken wanneer je website voor het laatst is gecrawld – het verbetert je positie in de zoekmachines niet. En soms is de opgeslagen versie van je site raar, onvolledig of gewoon fout.
Maar Google Cache heeft zeker nut voor website-eigenaren. Het is een snelle manier om te checken hoe je site is geïndexeerd en het kan je helpen bij het opsporen en diagnosticeren van problemen. Je kunt ook Google Search Console gebruiken om je positie in de zoekmachines te verbeteren.
Heb je nog vragen over Google Cache? Laat het ons weten in de comments – we willen ze horen!
Hi, ik heb mijn website jaren geleden veranderd en ben van 4.000 pagina’s naar 200 gegaan. Nu, 4 jaar later verschijnen de oude url’s nog steeds in:
– Google Search console: 2260 niet geïndexeerd en 202 wel geïndexeerd
– MOZ: top pagina’s van deze website
– 404 links via Rankmath
Ik heb geen idee hoe ik deze oude urls kan verwijderen. Daarnaast heb ik een relatief hoge PA van 46 en 24 voor een nieuwe pagina terwijl mijn DA 25 is.