Archiveer je blogposts bij de Wayback Machine

Enkele maanden geleden schreef ik over het voorkomen van linkrot op je blog door permanent werkende links te maken als je verwijst naar externe websites. Hierbij archiveer je andermans webpagina’s in o.a. de Wayback Machine zodat je er naar kunt verwijzen zonder bang te zijn dat de originele pagina’s veranderen of zelfs compleet verdwijnen. Maar andersom is dat natuurlijk net zo handig. Met de WordPress plugin van de Wayback Machine zorg je ervoor dat je eigen blogposts automatisch gearchiveerd worden en voor de eeuwigheid (?) veilig bewaard worden.

Wayback Machine

wayback machine savepagenow linkrot
De Wayback Machine maakt onderdeel uit van The Internet Archive die als doel heeft om zo’n beetje het hele internet te archiveren. Elke week worden er bijna een miljard webpagina’s als ‘snapshot’ bewaard waarbij de pagina’s – zoals ze er op dat moment uit zien – permanent gearchiveerd en daarna opgevraagd kunnen worden. Daar wordt een webcrawler voor gebruikt die het hele internet afstruint en niet alleen op zoek is naar nieuwe pagina’s maar ook kijkt welke bestaande (en al gearchiveerde) pagina’s gewijzigd zijn zodat er een nieuw snapshot gemaakt kan worden.

De Wayback Machine bewaart dus niet alleen losse webpagina’s maar houdt daar dus ook verschillende versies van bij die op een tijdlijn gepresenteerd worden. Op die manier kun je zowel eenvoudig kijken welke versie van een webpagina er gearchiveerd is maar ook alle wijzigingen van die pagina bekijken die er de afgelopen jaren zijn geweest. Mits die pagina natuurlijk ook al die tijd gearchiveerd is door de Wayback Machine.

wayback machine vakblog

In mijn geval zie je dat de voorpagina van Vakblog voor het eerst op 24 maart 2008 is gearchiveerd maar dat de webcrawler maar enkele keren in 2008, 2009 en 2010 voorbij is gekomen. In 2011, toen ik begon met dagelijks bloggen, is die frequentie enorm toegenomen omdat de Wayback Machine – net als Google – voorrang geeft aan sites die met regelmaat bijgewerkt worden. De voorpagina van een blog is daar een goed voorbeeld van.

Handmatig?

Maar ja, er zijn miljoenen blogs op het internet te vinden en het is maar de vraag of de Wayback Machine jouw blog uit zichzelf weet te vinden. Gelukkig kun je ook handmatig zelf een snapshot laten maken van een webpagina door op de voorpagina van de site een URL in te vullen bij Save Page Now.

Dat is leuk om te doen voor de voorpagina van je blog maar wordt pas echt nuttig als je de individuele blogposts gaat archiveren. De Wayback Machine archiveert namelijk niet automatisch je gehele blog als je de URL van je blog invult maar slechts de voorpagina. Wil je dus zorgen dat je blogposts permanent opgenomen worden in het gigantische webarchief, dan zul je ze één voor één moeten laten archiveren.

Waarom zou je je blogposts willen archiveren in de Wayback Machine? Behalve dat daarmee jouw blogposts permanent beschikbaar blijven, ook al zou je blog ooit verdwijnen, zijn er ook plannen van The Internet Archive om een Wayback Machine zoekmachine te ontwikkelen waarmee ook op inhoud gezocht kan worden in het webarchief. Mozilla en The Internet Archive zijn ook gezamenlijk bezig met een functie in de Firefox browser waarbij er automatisch gezocht wordt in de Wayback Machine als een site (in Google) niet meer te vinden is. En persoonlijk vind ik het een leuk idee dat mijn blogposts wellicht over 50 jaar nog gevonden kunnen worden, ver nadat zowel mijn blog als ikzelf er niet meer zijn. Tenzij ik 93 word en nog steeds aan het bloggen ben. Oef.

Geautomatiseerd in WordPress met de Archiver plugin

Gelukkig hoef je niet elke nieuwe blogpost handmatig toe te voegen aan de Wayback Machine als je gebruik maakt van WordPress. Er is een plugin – Archiver – beschikbaar die geheel automatisch een snapshot laat maken door de Wayback Machine op het moment dat je iets aan je blog wijzigt. Bijvoorbeeld als je een nieuwe blogpost of pagina publiceert maar ook als je een bestaande post of pagina aanpast.

Na installatie van de Archiver plugin – er zijn geen verdere instellingen nodig die je hoeft in te vullen – wordt de URL van elke nieuwe blogpost of pagina automatisch doorgegeven aan de Wayback Machine.

wayback machine
In de editor is er een nieuwe Archives metabox in de rechterkolom bijgekomen waar je – na het publiceren van de post – kunt zien welke snapshots van die post gemaakt zijn en kun je doorklikken naar de archiefpagina op de site van de Wayback Machine. In de menubalk van de admingebruiker (dat zal je zelf zijn als het goed is) is er ook een menu-optie Archiver bijgekomen die eveneens laat zien hoeveel snapshots er zijn van de post maar daarnaast ook de optie biedt om handmatig een nieuw snapshot te laten maken.

Als je ingelogd bent zie je de admin-menubalk ook op de voorpagina van je blog(post) en kun je dus ook daar zien hoeveel snapshots er van die pagina al gemaakt zijn.

wayback machine vakblog_front

Ik ben benieuwd of de gearchiveerde review van de Kobo Aura ONE in 2066 nog steeds gelezen kan worden ;)

@header afbeelding via Pixabay met CC0-verklaring

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (3) Write a comment

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top