Archiveren van webpagina’s met PDF, Evernote en MAFF

Hoewel ik meestal voldoende heb aan een bookmark om interessante sites te bewaren voor later, is dat eigenlijk vooral geschikt om ze tot enkele maanden daarna nog eens te kunnen nalezen of raadplegen. Als ik echter bij de wat oudere bookmarks in mijn browser (of delicious) kijk, dan is er al redelijk snel sprake van link rot: niet meer werkende links. Websites die verdwenen zijn, van domein zijn veranderd, die een grote schoonmaak in hun archieven gehouden hebben of die hun content nu achter een betaalmuur gezet hebben.

Ook al heb je bij bijna alle nieuws-, informatieve en wetenschappelijke websites tegenwoordig wel de beschikking over permalinks die in ieder geval een vaste en stabiele link geven naar de content, het is geen garantie dat je volgende maand of volgend jaar nog steeds de informatie op webpagina’s kunt raadplegen. Tel daar bij op dat het taggen van bookmarks -zodat je ook nog weet wat voor interessante informatie op die site stond- soms meer werk is dan eenvoudigweg de hele pagina te bewaren en dan heb je goede redenen om eens te kijken hoe nou het makkelijkste volledig webpagina’s bewaard kunnen worden.

PDF
Vroeger printte ik webpagina’s allemaal uit maar daar kun je natuurlijk tegenwoordig niet meer mee aankomen. Alternatief voor het printen is het installeren van een PDF printer waarmee je webpagina’s ‘uitprint’ naar PDF toe. Zelf heb ik daar jaren Adobe Acrobat voor gebruikt maar er zijn ook diverse gratis PDF programma’s beschikbaar waarbij je PDF’s kunt maken vanuit een browser. In Acrobat kun je zelfs hele sites importeren en de PDF’s zijn allemaal goed te doorzoeken aangezien zo’n beetje alle zoektools het formaat ondersteunen. Het nadeel van PDF is dat het uiteindelijk een papiergebaseerd iets is. Het is een leesbaar digitaal printje en dat betekent dat je op sites alle (ongewenste) opmaak mee krijgt zoals advertenties, menu’s enz. Ook werken niet alle links meer goed vanuit een PDF en zullen videobestanden genegeerd worden. Het is echter nog steeds beter dan kilo’s papier uit je printer laten komen.

Evernote
Je hebt meerdere programma’s die met zogenaamde webclippers selecties van (of hele) webpagina’s kunnen importeren maar mijn favoriet is Evernote. Je selecteert op een pagina wat je wil bewaren en het wordt meteen geïmporteerd in een nieuwe notitie in Evernote. De opmaak blijft behouden, afbeeldingen gaan netjes mee en het is natuurlijk gelijk volledig doorzoekbaar in Evernote zelf. Voor hele pagina’s gebruik ik meestal Evernote Clearly aangezien je hier juist alle opmaak, advertenties, menu’s enz met 1 druk op de knop verwijdert zodat je alleen de tekst (en afbeeldingen) overhoudt die je wilt lezen en bewaren. Uiteindelijk is Evernote echter vooral bedoeld om (stukken) informatie te bewaren die op webpagina’s te vinden is voor later gebruik, niet de hele webpagina zelf.

MAFF
Soms wil ik echter wel webpagina’s 1 op 1 archiveren zoals ze op dat moment zijn. Omdat ik juist ook de layout wil bewaren of omdat de koppeling met de precieze datum interessant is (nieuws op een specifieke dag). Of omdat ik alle afbeeldingen op 1 pagina in 1x keer wil bewaren.

In Internet Explorer kun je er dan voor kiezen om een pagina op te slaan in een Web Archive formaat (mht). Dat is een containerbestand waarin dan alle html, css, scriptjes en afbeeldingen opgeslagen worden zodat je later de pagina opnieuw kunt bekijken met precies dezelfde opmaak. Deze bestanden zijn normaliter alleen te maken en te openen in Internet Explorer maar met extensions kun je ze ook in andere browsers gebruiken.

De Mozilla Archive Format extension zorgt niet alleen voor ondersteuning van mht bestanden in Firefox maar voegt daar zijn eigen webarchief formaat aan toe met MAFF. MAFF lijkt op het MHT formaat maar heeft als voordeel dat het een open standaard is dat gebaseerd is op ZIP. Niet alleen dat, ook video en audio die in een pagina opgenomen is wordt opgeslagen in het archiefbestand en bij het openen van een MAFF bestand krijg je keurig de titel van de pagina te zien en de datum waarop dat archiefbestand is aangemaakt.

Na installatie van de extension heb je wat meer opties om pagina’s op te slaan in het Firefox menu. Zo kun je de huidige pagina opslaan als MHT of MAFF maar ook (een selectie van) alle openstaande tabs in 1 archiefbestand bewaren.

Ideaal voor al die keren dat je niet de url’s wilt bewaren maar de webpagina’s zelf.

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (4) Write a comment

  1. Pingback: Een boek schrijven met behulp van Evernote | Elja Daae

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top