Archiveren van webpagina’s met PDF, Evernote en MAFF

Hoewel ik meestal voldoende heb aan een bookmark om interessante sites te bewaren voor later, is dat eigenlijk vooral geschikt om ze tot enkele maanden daarna nog eens te kunnen nalezen of raadplegen. Als ik echter bij de wat oudere bookmarks in mijn browser (of delicious) kijk, dan is er al redelijk snel sprake van link rot: niet meer werkende links. Websites die verdwenen zijn, van domein zijn veranderd, die een grote schoonmaak in hun archieven gehouden hebben of die hun content nu achter een betaalmuur gezet hebben.

Ook al heb je bij bijna alle nieuws-, informatieve en wetenschappelijke websites tegenwoordig wel de beschikking over permalinks die in ieder geval een vaste en stabiele link geven naar de content, het is geen garantie dat je volgende maand of volgend jaar nog steeds de informatie op webpagina’s kunt raadplegen. Tel daar bij op dat het taggen van bookmarks -zodat je ook nog weet wat voor interessante informatie op die site stond- soms meer werk is dan eenvoudigweg de hele pagina te bewaren en dan heb je goede redenen om eens te kijken hoe nou het makkelijkste volledig webpagina’s bewaard kunnen worden.

PDF
Vroeger printte ik webpagina’s allemaal uit maar daar kun je natuurlijk tegenwoordig niet meer mee aankomen. Alternatief voor het printen is het installeren van een PDF printer waarmee je webpagina’s ‘uitprint’ naar PDF toe. Zelf heb ik daar jaren Adobe Acrobat voor gebruikt maar er zijn ook diverse gratis PDF programma’s beschikbaar waarbij je PDF’s kunt maken vanuit een browser. In Acrobat kun je zelfs hele sites importeren en de PDF’s zijn allemaal goed te doorzoeken aangezien zo’n beetje alle zoektools het formaat ondersteunen. Het nadeel van PDF is dat het uiteindelijk een papiergebaseerd iets is. Het is een leesbaar digitaal printje en dat betekent dat je op sites alle (ongewenste) opmaak mee krijgt zoals advertenties, menu’s enz. Ook werken niet alle links meer goed vanuit een PDF en zullen videobestanden genegeerd worden. Het is echter nog steeds beter dan kilo’s papier uit je printer laten komen.

Evernote
Je hebt meerdere programma’s die met zogenaamde webclippers selecties van (of hele) webpagina’s kunnen importeren maar mijn favoriet is Evernote. Je selecteert op een pagina wat je wil bewaren en het wordt meteen geïmporteerd in een nieuwe notitie in Evernote. De opmaak blijft behouden, afbeeldingen gaan netjes mee en het is natuurlijk gelijk volledig doorzoekbaar in Evernote zelf. Voor hele pagina’s gebruik ik meestal Evernote Clearly aangezien je hier juist alle opmaak, advertenties, menu’s enz met 1 druk op de knop verwijdert zodat je alleen de tekst (en afbeeldingen) overhoudt die je wilt lezen en bewaren. Uiteindelijk is Evernote echter vooral bedoeld om (stukken) informatie te bewaren die op webpagina’s te vinden is voor later gebruik, niet de hele webpagina zelf.

MAFF
Soms wil ik echter wel webpagina’s 1 op 1 archiveren zoals ze op dat moment zijn. Omdat ik juist ook de layout wil bewaren of omdat de koppeling met de precieze datum interessant is (nieuws op een specifieke dag). Of omdat ik alle afbeeldingen op 1 pagina in 1x keer wil bewaren.

In Internet Explorer kun je er dan voor kiezen om een pagina op te slaan in een Web Archive formaat (mht). Dat is een containerbestand waarin dan alle html, css, scriptjes en afbeeldingen opgeslagen worden zodat je later de pagina opnieuw kunt bekijken met precies dezelfde opmaak. Deze bestanden zijn normaliter alleen te maken en te openen in Internet Explorer maar met extensions kun je ze ook in andere browsers gebruiken.

De Mozilla Archive Format extension zorgt niet alleen voor ondersteuning van mht bestanden in Firefox maar voegt daar zijn eigen webarchief formaat aan toe met MAFF. MAFF lijkt op het MHT formaat maar heeft als voordeel dat het een open standaard is dat gebaseerd is op ZIP. Niet alleen dat, ook video en audio die in een pagina opgenomen is wordt opgeslagen in het archiefbestand en bij het openen van een MAFF bestand krijg je keurig de titel van de pagina te zien en de datum waarop dat archiefbestand is aangemaakt.

Na installatie van de extension heb je wat meer opties om pagina’s op te slaan in het Firefox menu. Zo kun je de huidige pagina opslaan als MHT of MAFF maar ook (een selectie van) alle openstaande tabs in 1 archiefbestand bewaren.

Ideaal voor al die keren dat je niet de url’s wilt bewaren maar de webpagina’s zelf.

#

Samenwerken en document management met Sharepoint 2010 (Sharenet 2.0)

De eerste helft van 2009 zal nog vele jaren in mijn geheugen gegrift blijven. Niet alleen was het prive een drukke tijd met de komst van onze dochter en de daaropvolgende extreem korte nachten, op werk was het ook erg druk met het project Sharenet waarin we in een relatief kort tijdsbestek van (o.a.) Novell netwerkschijven, Groupwise en Office XP over gingen naar Active Directory, Outlook, Office 2007 en Sharepoint 2007. Vooral de introductie van Sharepoint betekende een enorme verandering in de wijze hoe meer dan 1000 medewerkers omgingen met hun documenten en het samenwerken rondom die documenten. Van uitgebreide mappenstructuren en een complexe wirwar van rechten hierop tot documentbibliotheken, categoriën en tags. Dat is zonder overdrijven niet heel eenvoudig gegaan.

Als lerende organisatie kon je er op wachten dat we met een Sharenet 2.0 project zouden gaan komen. Wat heeft er wel gewerkt, wat niet en vooral, wat kan beter? Inmiddels is ook Sharepoint zelf verbeterd met een 2010 versie maar hoewel er zeker op het gebied van taxonomieën, webparts en document bibliotheken flinke technische vernieuwingen zijn doorgevoerd, verkijk ik me daar niet op. Als ik 1 les geleerd heb van de twee intranetprojecten waar ik de laatste 10 jaar aan meegewerkt heb, dan is het wel dat de echte uitdaging zit in het vinden van een consensus die voldoende recht doet aan enerzijds de wensen en eisen van al die gebruikers in onze organisatie en anderzijds ook de beperkingen die een technisch systeem nu eenmaal altijd heeft. Ook al sleutelen ze nog 100 jaar aan Sharepoint of welk systeem dan ook, het feit dat al die duizenden mensen er mee moeten gaan werken met die enorme verscheidenheid aan wensen maar ook kennis en bereidwilligheid  om er mee te willen en kunnen werken, is al voldoende om te beseffen dat er geen ideale oplossing bestaat.

In 2009 heb ik me -heel erg- druk gemaakt om het gebruik van kenmerken (o.a. tags, categoriën) te promoten en diverse nota’s geschreven over documentbeheer in Sharepoint document libraries. Ook al ben ik nog steeds overtuigd van de grote meerwaarde van deze manier van werken, ik sta wel met met twee benen weer op de grond. Op enkele goede voorbeelden na is de overgrote meerderheid van onze medewerkers gewoon uitgebreide mappenstructuren blijven maken en springen de tranen me zowat in de ogen als ik zie wat er van al mijn inspanningen is terecht gekomen om tenminste consequent een doordachte naamgeving van documenten te hanteren. Nadenken hoe je met documenten werkt als individu is al lastig maar hoe je dit regelt, organiseert en vooral consequent doorvoert en handhaaft, dat is toch kennelijk meer mijn ding als informatiespecialist en niet zozeer die van andere medewerkers.

Helemaal opgegeven heb ik het niet maar ik ga echt niet meer op de barricades voor een in mijn ogen optimaal gebruik van documentlibraries, teamsites en Sharepoint. Dat zou ook een beetje hypocriet zijn want, zoals je zou kunnen weten als je af en toe dit blog leest, gebruik ik zelf voor mijn eigen documenten consequent Dropbox -in mapjes- met af en toe een uitstapje naar Google Docs Drive. Tel daar mijn eigen mailarchiveringssysteem en recente obsessie met Evernote nog even bij op en het wordt ook duidelijk dat ik zelf Sharenet niet meer gebruik voor mijn eigen documenten. Alleen nog voor met de afdeling gedeelde documenten, daar is en blijft Sharenet best handig voor.

In de aanloop vorig jaar naar Sharenet 2.0 is gelukkig wel opgepakt dat Sharepoint niet hoeft/moet/kan concurreren met Dropbox en -toen nog- Google Docs maar dat je er wel van kunt leren. Dat je dus moet kijken hoe je de functionaliteiten  waar gebruikers op zitten te wachten combineert met de voordelen die een intern systeem heeft. Al je collega’s zijn al lid bijvoorbeeld en hebben een account. Maar hoe pak je de mobiele functionaliteiten erbij? Hoe maak je het delen van bestanden met 1 of enkelen net zo makkelijk als in bijvoorbeeld Dropbox. Of Google Drive. Of Skydrive.

En ook al besloot ik eerder dit jaar om niet actief aan het project Sharenet 2.0 deel te gaan nemen -onder de noemer once bitten twice shy-, ik ontkom er toch niet helemaal aan. Ik kreeg vandaag de uitnodiging om volgende week deel te nemen aan een bijeenkomst over samenwerken en document management waarbij in een voorbeeld Sharepoint 2010 omgeving een aantal oplossingsrichtingen getoond gaan worden aan de hand van die eerder gemelde wensen en eisen.

En ik ben nieuwsgierig. Ik wil weten wat het gaat worden. Die uitnodiging sla ik niet af.

Wordt vervolgd.

#

Storage Wars – Return of the USB Stick


Mijn eerste USB stick (de linker) kocht ik ergens aan einde van de vorige eeuw. Ik weet nog dat die stinkend duur was en dat ik het nog in guldens betaald heb. Het betekende voor mij het einde van het iedere keer branden van bestanden op een CD-RW en daar was ik erg blij mee. Welk merk ik ook kocht van rewritable cd’s, ze gaven me altijd problemen. Gewoon 256 MB mee kunnen nemen in je broekzak, ik vond het serieus de beste uitvinding van die periode.

Ik heb er later nog heel wat meer gekocht want opslag, daar kon ik in ieder geval niet genoeg van hebben. Behalve die sticks op de foto liggen er nog een stuk of 10 in een bureaulade, allemaal in meer of mindere mate gebruikt toen ze goedkoper in de aanschaf werden.

Opslag in de cloud maakte grotendeels een eind aan de groei van mijn verzameling USB sticks. Niet meer onthouden of je de laatste versie van dat document op je stick had gezet (en welke stick was het ook al weer?) maar gewoon via Dropbox altijd beschikbaar. Echter, voor sommige dingen blijft het toch best wel handig of zelfs nodig om een USB stick bij de hand te hebben. Ook al zijn ze ze tegenwoordig belachelijk groot qua opslag en belachelijk klein qua grootte. De rechterstick is een aankoop van vandaag en voor 10 euro heb je een 16GB usb stick die zowat wegwaait als je diep uitademt. Enfin.

Welke redenen zijn er om je verzameling USB sticks nog aan te houden?

  • Soms moet je (zeer) grote bestanden meenemen. Videobestanden bijvoorbeeld. Dat kan via Dropbox maar dat duurt bijzonder lang. Zelfs de traagste USB stick is sneller dan je uploadsnelheid naar cloud opslagdiensten;
  • Soms heb je bestanden nodig op een plek waar geen internet is of waar je niet bij je Dropbox, Google Drive of wat dan ook kunt komen. Ik heb een paar sticks van 128 MB waar ik bijvoorbeeld mijn Powerpoint presentaties op meeneem. Ook anno 2012 is het nog nodig om tenminste een stick met je presentatie achter de hand te hebben en je kunt die Prezi fans uitlachen die alles online hebben staan;
  • Leuk voor later. USB sticks geven een tijdsbeeld. Die linker op de foto bevatte foto’s en documenten van ruim 12 jaar oud. Geen idee dat ik ze nog had en het blijft een soort permanente verrassing wat je er op aantreft. Eén oude stick bleek nog een virus te bevatten die 10 jaar later zonder problemen door een recent antivirusprogramma werd opgeschoond. Dolle pret ;)
  • Het goede excuus. Met cloud opslag heb je je documenten die je af zou maken altijd bij de hand. Met USB sticks kan het wel eens fout gaan. Verkeerde stick meegenomen, per ongeluk in de wasmachine of inderdaad weggewaaid toen ik diep uitademde van opluchting. Ja sorry, ik weet dat ik beloofd had om dat document te schrijven maar het staat op een andere usb stick denk ik. Sorry. Morgen dan maar?

En? Gebruik jij nog een USB stick?

#

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top