Zoeken naar verdwenen websites en webpagina’s in Google Cache

google cache in searchToegegeven, heel vaak zul je waarschijnlijk niet op zoek gaan naar websites of webpagina’s die om één of andere reden offline zijn gehaald en dus niet meer te bekijken zijn. Maar toch is Google Cache (ook) een interessant hulpmiddel om na te kijken hoe een bepaalde pagina of site er uitzag voordat er iets gewijzigd werd.

Bijvoorbeeld omdat je gisteren bepaalde informatie op een site zag staan die er vandaag niet meer te vinden is. Of omdat je op je eigen site of blog iets kleins veranderd hebt zonder een backup te maken. Met behulp van Google Cache kun je meestal terugvinden hoe een site of webpagina er enkele dagen geleden uitzag. Inclusief afbeeldingen en andere bestanden. Een soort tijdmachine voor het web zeg maar.

Wat is Google Cache?

Google Cache is feitelijk de achterliggende (gigantische) database met websites en webpagina’s van de Google zoekmachine. Google is onophoudelijk bezig met het indexeren en bewaren van alle websites en pagina’s voor hun zoekmachine. Dat doet het (o.a.) door een momentopname te maken van een website en die in zijn geheel te archiveren. Google maakt dus eigenlijk een backup van alle websites die ze indexeren met alles erop en eraan (webpagina’s maar ook alle gebruikte bestanden en afbeeldingen). Backups die eens in de zoveel tijd ververst worden omdat sites nu eenmaal snel veranderen en er vervolgens een nieuwe momentopname gemaakt wordt.

Al die miljarden sites en pagina’s samen vormen de Google Cache. Het is wat Google gebruikt om de zoekresultaten te matchen met de zoekvraag in de zoekmachine. Alle zoekresultaten die getoond worden als je zoekt in Google zijn afkomstig uit de Google Cache. Pas als je doorklikt op een zoekresultaat ga je naar de actuele site zoals die ook daadwerkelijk op het internet te vinden is.

Die backups, die momentopnames, zijn per definitie niet actueel. Afhankelijk van de populariteit van de site en hoe vaak de content verandert wordt een momentopname meerdere keren per dag (denk aan Wikipedia), maar nog vaker pas na enkele dagen, ververst. En die (kleine) vertraging zorgt er voor dat je aangepaste of verwijderde pagina’s en bestanden nog wel kunt terugvinden in de Google Cache terwijl ze op de actuele site verdwenen zijn.

Wil je verder terugkijken dan enkele uren of enkele dagen? Dan is er de Wayback Machine van Archive.org die eveneens met enige regelmaat websites archiveert. De Wayback Machine houdt een veel groter archief bij (van Vakblog zijn er op dit moment 99 backups te vinden waarvan de oudste uit 2008 dateert) maar is minder volledig. De voorpagina en de pagina’s waar vanaf de voorpagina naar gelinkt wordt zijn goed gearchiveerd maar dat geldt vaak niet voor alle andere onderdelen van een site. Desondanks wel een mooie site om te bekijken hoe je eigen blog er jaren geleden uitzag.

Doorzoeken van Google Cache

Je kunt op meerdere manieren de Google Cache doorzoeken om een bepaalde site of webpagina te vinden.

  • De gemakkelijkste manier is via Google zelf: bij alle URL’s in de zoekresultaten zie je een klein pijltje (omlaag) staan. Klik daar op en je krijgt de mogelijkheid om op vergelijkbare sites te zoeken – ook een aanrader – en om de site in de cache te bekijken;
  • Er zijn speciale zoekmachines die zich gespecialiseerd hebben in het doorzoeken van Google Cache. Eén daarvan is CachedView die ook meteen bij elke gezochte site doorlinkt naar de Wayback Machine;
  • Zelf een zoekmachine configureren in Chrome of Firefox. Beide browsers bewaren alle sites met een zoekfunctie en je kunt door trefwoorden te koppelen aan de bewaarde zoekfuncties rechtstreeks vanuit de adresbalk Google Cache doorzoeken. Mits je die toevoegt natuurlijk. Je vindt een uitleg over die aangepaste zoekmachines in een andere blogpost inclusief een toelichting hoe je daar in Chrome je eigen zoekmachines aan toevoegt. Gebruik daarbij een trefwoord naar keuze (ik heb ‘cache’ genomen) en de URL: http://webcache.googleusercontent.com/search?q=cache:%s

Hoe ziet Google Cache er uit?

Heb je eenmaal een site of webpagina opgezocht in Google Cache dan zie je de site of pagina zoals die in de cache aanwezig is. Het enige verschil is dat er bovenaan een balkje staat met de melding dat je in de cache aan het kijken bent, van welke datum de momentopname is en een waarschuwing dat de huidige pagina in de tussentijd veranderd kan zijn.

google cache text
Standaard krijg je de Volledige versie van de pagina te zien die alles toont zoals het ook op het internet te vinden was. Maar je kunt ook kiezen voor een Tekstversie die geen afbeeldingen en scripts laadt waardoor je alleen een kale – en snelle(!) – pagina overhoudt waar je snel door kunt kijken. Dat is vooral handig als het dus een site is die ook veel tekst bevat zoals bij een Wikipedia pagina bijvoorbeeld.

De volledige versie van een site via Google Cache bekijken is ook handig als je tijdelijk op een langzame verbinding aan het werken bent. De servers van Google zijn gemiddeld genomen sneller dan die van de webhosts en via Google Cache zal een site sneller laden dan de actuele site. Gaat dat nog steeds traag, dan kun je de tekstversie opvragen.

Sinds vorige maand is er een derde weergaveoptie toegevoegd aan Google Cache. Je kunt nu ook de Bron weergeven van de bewaarde pagina. Dit toont de HTML code zodat je kunt zien wat er eventueel achter de schermen aangepast is.

Oftewel, wil je weten hoe je eigen site of die van een andere door Google geïndexeerd is? Zag je gisteren ergens iets op een site staan dat er vandaag niet meer staat? Heb je per ongeluk een blogpost of tekst van je blog verwijderd en wil je die weer herstellen met wat kopiëren en plakken? Of wil je een site/pagina bekijken die ineens offline is?

Kijk dan eens in Google Cache.

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (9) Write a comment

  1. Hoi Raymond,

    Ik zit op de website van Booking.com en als ik daar de creditcardinformatie opvraagt, dat mag ik als B&B eigenaar, dan overschrijft de website soms de pagina binnen 1 sec. Die kan ik dan weer oproepen, maar dan staat de cvc code er niet meer bij. Hoe kan ik die overschre en pagina weer oproepen?

    Reply

    • Sorry Herman, ik heb werkelijk geen idee behalve dat ik redelijk zeker weet dat het juist niet de bedoeling is dat de CVC code zichtbaar wordt. Die code moet altijd expliciet opgegeven worden als verificatie en mag niet opgeslagen worden. Je zou hem dus uberhaupt niet mogen zien eigenlijk …

      Reply

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2018 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top