wayback machine logo

3 manieren om webpagina’s te archiveren in de Wayback Machine

Je zou kunnen denken dat informatie op het internet voor eeuwig terug te vinden is maar toch verdwijnen er elk jaar ontelbare webpagina’s van het web. Omdat de eigenaren het geld er niet meer voor over hebben om de sites in de lucht te houden bijvoorbeeld of omdat ze simpelweg verwijderd worden (al dan niet door censuur).

Ik schreef al eerder over het archiveren van webpagina’s waar je zelf naar linkt om linkrot te voorkomen en ook hoe je je eigen blogposts kunt archiveren in de Wayback Machine om ze wel voor de eeuwigheid te bewaren. Maar wat als je een interessante webpagina wilt bewaren en zeker wilt zijn dat je die later nog kunt raadplegen? Dan zijn er drie gemakkelijke manieren om snel webpagina’s te archiveren in de Wayback Machine.

Waarom zou je webpagina’s willen archiveren?

Het lijkt misschien overbodig om webpagina’s te (laten) archiveren maar zodra er voor jou interessante informatie op te vinden is, kun je er belang bij hebben om te kunnen verwijzen naar die webpagina zoals die op dat specifieke moment was. Bijvoorbeeld omdat je de informatie van die webpagina gebruikt als onderbouwing van je eigen argumenten en je er in een blogpost, artikel of op social media aan wilt refereren. En dan is het bijzonder lastig dat zo’n webpagina achteraf gewijzigd wordt of zelfs compleet verdwijnt.

wayback machine logoGelukkig kun je met (o.a.) de Wayback Machine een snapshot maken van elke willekeurige webpagina. Een archiefkopie van een webpagina zoals die er uit zag op het moment dat je die pagina archiveerde. Die archiefkopie wordt op de servers van de Wayback Machine bewaard zodat je altijd kunt verwijzen naar die specifieke pagina op dat specifieke moment dat jij het geraadpleegd hebt.

Het is (gelukkig) wel zo dat de Wayback Machine ook zelf actief webpagina’s archiveert. Elke week worden er bijna een miljard webpagina’s als snapshot bewaard. Daar wordt een webcrawler voor gebruikt die het hele internet afstruint en die niet alleen op zoek is naar nieuwe pagina’s maar ook kijkt welke bestaande (en handmatig gearchiveerde) pagina’s gewijzigd zijn zodat er een nieuw snapshot gemaakt kan worden.

De Wayback Machine bewaart dus niet alleen losse webpagina’s maar houdt daar dus ook verschillende versies van bij die op een tijdlijn gepresenteerd worden. Op die manier kun je zowel eenvoudig kijken welke versie van een webpagina er gearchiveerd is maar ook alle wijzigingen van die pagina bekijken die er de afgelopen jaren zijn geweest. Mits die pagina natuurlijk ook al die tijd gearchiveerd is door de Wayback Machine.

wayback machine

Handmatig webpagina’s archiveren in de Wayback Machine

Natuurlijk kun je hopen (en vaak is het ook wel zo) dat webpagina’s al in het gigantische archief van de Wayback Machine zitten. Maar als je er zeker van wilt zijn dat je een webpagina kunt terugvinden zoals die er op dat specifieke moment eruit zag, dan kun/moet je het handmatig toevoegen. Dat kan op meerdere manieren:

1. Via de voorpagina van de Wayback Machine website

wayback machine save page now

Plak de URL van de webpagina die je wilt archiveren in het mini formuliertje onder het kopje Save Page Now en er wordt meteen een archiefkopie gemaakt. Je wordt na enkele momenten ook automatisch doorgestuurd naar de archiefkopie zodat je die URL kunt kopiëren voor later gebruik. De webpagina wordt volledig bewaard (inclusief alle afbeeldingen en opmaak) maar in de archiefkopie worden de pagina’s waar naar gelink wordt vervolgens niet bewaard. Je kunt dit dus niet gebruiken om bijv. een volledige website te archiveren. Overigens houdt de Wayback Machine niet bij wie de archiefkopie aanvraagt en dat is dus volledig anoniem.

2. Met behulp van de Chrome extensie

Geen zin om telkens een URL te kopiëren, naar de site van de Wayback Machine te gaan en daar die URL te plakken in het formuliertje? Dan kun je gebruik maken van de officiële extensie voor de Chrome browser.

wayback machine chrome extensionMet de extensie heb je alle functionaliteiten van de Wayback Machine meteen bij de hand. Je kunt meteen vanuit de toolbar naast de adresbalk de webpagina archiveren die je op dat moment actief hebt in de browser. Maar ook de recentste versie en zelfs de allereerste versie opvragen van de webpagina in de Wayback Machine zodat je de actuele versie meteen kunt vergelijken met oudere versies.

En nog handiger … als je een dode link tegenkomt (een 404 foutmelding) tijdens het surfen dan biedt de extensie automatisch aan om de gearchiveerde versie op te halen. Mits die versie bestaat natuurlijk.

Die functionaliteit is op dit moment de enige die in de Firefox add-on te vinden is maar deze zal in de toekomst uitgebreid worden met dezelfde mogelijkheden als de Chrome extensie.

3. Met behulp van een Javascript bookmarklet

Liever geen Chrome extensie? Of gebruik je een andere browser? Dan kun je een eenvoudige bookmarklet gebruiken: een regeltje Javascript die je kunt selecteren en slepen naar de bookmarks toolbar.

Deze bookmarklet kun je vinden bij Wikipedia omdat editors verplicht zijn om te verwijzen naar gearchiveerde webpagina’s in artikelen en deze methode werkt voor alle gangbare browsers. De bookmarklet kun je ook hieronder selecteren en slepen naar de bookmarks.

javascript:void(window.open('https://web.archive.org/web/*/'+location.href));

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (4) Write a comment

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top