wayback machine logo

3 manieren om webpagina’s te archiveren in de Wayback Machine

Je zou kunnen denken dat informatie op het internet voor eeuwig terug te vinden is maar toch verdwijnen er elk jaar ontelbare webpagina’s van het web. Omdat de eigenaren het geld er niet meer voor over hebben om de sites in de lucht te houden bijvoorbeeld of omdat ze simpelweg verwijderd worden (al dan niet door censuur).

Ik schreef al eerder over het archiveren van webpagina’s waar je zelf naar linkt om linkrot te voorkomen en ook hoe je je eigen blogposts kunt archiveren in de Wayback Machine om ze wel voor de eeuwigheid te bewaren. Maar wat als je een interessante webpagina wilt bewaren en zeker wilt zijn dat je die later nog kunt raadplegen? Dan zijn er drie gemakkelijke manieren om snel webpagina’s te archiveren in de Wayback Machine.

Waarom zou je webpagina’s willen archiveren?

Het lijkt misschien overbodig om webpagina’s te (laten) archiveren maar zodra er voor jou interessante informatie op te vinden is, kun je er belang bij hebben om te kunnen verwijzen naar die webpagina zoals die op dat specifieke moment was. Bijvoorbeeld omdat je de informatie van die webpagina gebruikt als onderbouwing van je eigen argumenten en je er in een blogpost, artikel of op social media aan wilt refereren. En dan is het bijzonder lastig dat zo’n webpagina achteraf gewijzigd wordt of zelfs compleet verdwijnt.

wayback machine logoGelukkig kun je met (o.a.) de Wayback Machine een snapshot maken van elke willekeurige webpagina. Een archiefkopie van een webpagina zoals die er uit zag op het moment dat je die pagina archiveerde. Die archiefkopie wordt op de servers van de Wayback Machine bewaard zodat je altijd kunt verwijzen naar die specifieke pagina op dat specifieke moment dat jij het geraadpleegd hebt.

Het is (gelukkig) wel zo dat de Wayback Machine ook zelf actief webpagina’s archiveert. Elke week worden er bijna een miljard webpagina’s als snapshot bewaard. Daar wordt een webcrawler voor gebruikt die het hele internet afstruint en die niet alleen op zoek is naar nieuwe pagina’s maar ook kijkt welke bestaande (en handmatig gearchiveerde) pagina’s gewijzigd zijn zodat er een nieuw snapshot gemaakt kan worden.

De Wayback Machine bewaart dus niet alleen losse webpagina’s maar houdt daar dus ook verschillende versies van bij die op een tijdlijn gepresenteerd worden. Op die manier kun je zowel eenvoudig kijken welke versie van een webpagina er gearchiveerd is maar ook alle wijzigingen van die pagina bekijken die er de afgelopen jaren zijn geweest. Mits die pagina natuurlijk ook al die tijd gearchiveerd is door de Wayback Machine.

wayback machine

Handmatig webpagina’s archiveren in de Wayback Machine

Natuurlijk kun je hopen (en vaak is het ook wel zo) dat webpagina’s al in het gigantische archief van de Wayback Machine zitten. Maar als je er zeker van wilt zijn dat je een webpagina kunt terugvinden zoals die er op dat specifieke moment eruit zag, dan kun/moet je het handmatig toevoegen. Dat kan op meerdere manieren:

1. Via de voorpagina van de Wayback Machine website

wayback machine save page now

Plak de URL van de webpagina die je wilt archiveren in het mini formuliertje onder het kopje Save Page Now en er wordt meteen een archiefkopie gemaakt. Je wordt na enkele momenten ook automatisch doorgestuurd naar de archiefkopie zodat je die URL kunt kopiëren voor later gebruik. De webpagina wordt volledig bewaard (inclusief alle afbeeldingen en opmaak) maar in de archiefkopie worden de pagina’s waar naar gelink wordt vervolgens niet bewaard. Je kunt dit dus niet gebruiken om bijv. een volledige website te archiveren. Overigens houdt de Wayback Machine niet bij wie de archiefkopie aanvraagt en dat is dus volledig anoniem.

2. Met behulp van de Chrome extensie

Geen zin om telkens een URL te kopiëren, naar de site van de Wayback Machine te gaan en daar die URL te plakken in het formuliertje? Dan kun je gebruik maken van de officiële extensie voor de Chrome browser.

wayback machine chrome extensionMet de extensie heb je alle functionaliteiten van de Wayback Machine meteen bij de hand. Je kunt meteen vanuit de toolbar naast de adresbalk de webpagina archiveren die je op dat moment actief hebt in de browser. Maar ook de recentste versie en zelfs de allereerste versie opvragen van de webpagina in de Wayback Machine zodat je de actuele versie meteen kunt vergelijken met oudere versies.

En nog handiger … als je een dode link tegenkomt (een 404 foutmelding) tijdens het surfen dan biedt de extensie automatisch aan om de gearchiveerde versie op te halen. Mits die versie bestaat natuurlijk.

Die functionaliteit is op dit moment de enige die in de Firefox add-on te vinden is maar deze zal in de toekomst uitgebreid worden met dezelfde mogelijkheden als de Chrome extensie.

3. Met behulp van een Javascript bookmarklet

Liever geen Chrome extensie? Of gebruik je een andere browser? Dan kun je een eenvoudige bookmarklet gebruiken: een regeltje Javascript die je kunt selecteren en slepen naar de bookmarks toolbar.

Deze bookmarklet kun je vinden bij Wikipedia omdat editors verplicht zijn om te verwijzen naar gearchiveerde webpagina’s in artikelen en deze methode werkt voor alle gangbare browsers. De bookmarklet kun je ook hieronder selecteren en slepen naar de bookmarks.

javascript:void(window.open('https://web.archive.org/web/*/'+location.href));

#

legale films film.nl

Zoeken naar legale films en series met Film.nl

Afgelopen week werd de zoekmachine Film.nl gelanceerd waarmee je kunt zien waar en hoe je een bepaalde film of serie het gemakkelijkste legaal kunt bekijken. De zoekmachine verwijst door naar diensten als Netflix, Ziggo en Videoland, fysieke exemplaren bij webwinkel Bol maar ook als ze binnenkort op televisie worden uitgezonden. Is dit echter voldoende om het illegaal downloaden tegen te gaan?

Van illegaal downloaden naar beter legaal aanbod?

Dat de Nederlandse bedrijven in de entertainmentindustrie al jaren met lede ogen (en vermanende vingertjes) aanzien hoe mensen hun films en tv-series illegaal downloaden, dat is niets nieuws. Behalve met veelvuldig klagen over en dreigen met het opsporen van foute film- en tvkijkertjes zijn ze echter niet met een constructief idee gekomen dat een oplossing zou kunnen zijn. Of het moet het idee zijn om een miljoenenclaim in te dienen bij de overheid?

Nu gooit de industrie het dan eindelijk over een andere boeg. Wellicht dat ze inzagen dat veel mensen waarschijnlijk illegaal downloaden omdat het de makkelijkste manier is om een film of serie te kijken? Of dat ze zelf ook wel begrepen dat als mensen geen idee hebben waar de legale versies te vinden zijn, je ze ook moeilijk kunt aanspreken op het illegaal downloaden? Of misschien zochten ze zelf ook hele avonden door de catalogus van Netflix, Ziggo en Videoland naar die ene film om te kijken?

Hoe dan ook, afgelopen week kwam de Nederlandse entertainmentindustrie met Film.nl. Een site en zoekmachine waar je (idealiter) voor elke film en serie een legale bron zou moeten kunnen vinden.

Wegwijzer naar legale films en series

legale films film.nl justified

Om eerst maar even de olifant in de kamer te benoemen: Film.nl heeft maar één doel en dat is mensen ervan te overtuigen dat ze niet moeten downloaden … maar in plaats daarvan naar legaal aanbod te kijken. En dat doen ze door puur een lijst van bronnen te geven waar je dat aanbod kunt vinden. In het bovenstaande voorbeeld (de tv serie Justified) zie je dus dat de serie bij Ziggo Movies & Series XL te vinden is en dat je de dvd’s kunt kopen bij Bol en Mediamarkt.

Dat is behoorlijk karig en incompleet natuurlijk. Er wordt niet doorgelinkt naar de series op de streamingdiensten van Ziggo, Netflix of Videoland en het is ook maar de vraag of je daar een abonnement op hebt. Het is ook logisch dat je bij Bol en de Mediamarkt de serie of film kunt kopen maar ja, mensen die voornemens zijn om een serie te gaan downloaden hebben waarschijnlijk nou net niet de intentie om 20 euro per seizoen te gaan neertellen. En zelfs als ze dat wel zouden willen doen, ook deze knoppen linken alleen maar naar de homepages van de Bol en Mediamarkt websites. Je zult daarna nog steeds zelf op zoek moeten om de dvd’s te vinden in de webwinkels.

legale films john wick

Het aantal bronnen kan ook enorm verschillen van film tot film. Als je op John Wick zoekt, dan krijg je voor het eerste deel maar liefst negen bronnen. Variërend van de huurprijs bij iTunes, de aanwezigheid op zowel Ziggo, Netflix als Videoland, fysieke exemplaren in diverse webwinkels en zelfs de vermelding dat de film a.s. woensdag om 21.40 wordt uitgezonden op RTL7. Ronduit indrukwekkend.

Maar je vindt ook John Wick 2 en dat is best bijzonder want die gaat pas a.s. vrijdag in première. Logisch dus dat je geen enkele bron aantreft voor deze film en dat er alleen een trailer te vinden is.

Kijk je vervolgens naar de beschrijvende tekst die bij elke film en serie staat, dan wordt meteen duidelijk waarom Film.nl de moeite neemt om ook alle films en series mee te nemen waar niet eens een legaal aanbod voor is.

legale films film.nl

Jawel, bij ELKE serie en ELKE film staat een tekst waarbij de meest logische zoektermen, waar downloaders de serie of film op zouden zoeken in Google, in verwerkt zijn. En niet zo subtiel ook.

legale films film.nl

Allemaal bedoeld om de zoekresultaten in Google te beïnvloeden en op die manier downloaders te ‘lokken’ naar Film.nl. Waar je vervolgens natuurlijk geen gratis films of series gaat vinden. Het is zeer twijfelachtig of Film.nl de illegale downloaders gaat overtuigen om hun portemonnee te trekken. Het is wederom dezelfde klassieke fout die de entertainmentindustrie maakt: richten op het corrigeren van het gedrag van downloaders in plaats van aantonen wat de meerwaarde van het legale aanbod kan zijn.

Wel op zoek naar legaal aanbod?

Ben je echter niet zo geïnteresseerd in downloaden en wil je alleen weten waar je het goedkoopst een film of serie kunt kopen of kijken? Of heb je een abonnement op meerdere videodiensten en heb je geen flauw idee welke series en films daar op te vinden zijn?

Dan is Film.nl gewoon een hele handige zoekmachine met heel veel bronnen die je dan in één keer kunt doorzoeken.  Vooral het feit dat het actueel lijkt te zijn met de constant wisselende catalogi van Netflix, Ziggo en Videoland is een groot voordeel, net als het feit dat het ook weet welke films en series de komende tijd op TV uitgezonden worden. Ik heb zelf abonnementen op Ziggo Movies & Series XL, Netflix en Amazon Prime Video en het is heel handig om op één plek te zien waar welke serie of film te bekijken is. Overigens is Amazon Prime Video jammer genoeg (nog?) niet als bron opgenomen.

Het is te hopen dat de makers van Film.nl snel beseffen dat geen enkele downloader zit te wachten op een site die ze verwijst naar betaalde versies. Maar dat er meer dan genoeg mensen geïnteresseerd zijn om een plek te hebben waar ze juist gemakkelijk de legale films en series kunnen vinden die ze zoeken. Mits er ook nog meer mogelijkheden worden toegevoegd aan de site om het ook echt bruikbaar te maken.

Zorg er bijvoorbeeld voor dat je meteen kunt doorklikken naar de series en films bij de videodiensten als je een abonnement hebt. En zorg er voor dat er meteen wordt doorverwezen naar de productpagina’s van de dvd’s bij de webwinkels. Draaien de films nog in de bioscoop? Waarom wordt er dan niet gelinkt naar de filmpagina’s van de grote bioscoopketens om meteen een kaartje te kopen of te reserveren?

Op die manier maak je het namelijk pas echt aantrekkelijk om te kiezen voor het legale aanbod in plaats van voor een illegale download.

#

onedrive document scannen

OneDrive gebruiken voor scannen en terugvinden van documenten, whiteboards en visitekaartjes

Bewaar jij alle papieren documenten in ordners of archiefdozen? Heb jij nog een Rolodex voor visitekaartjes? En werk je het liefst een volgeschreven whiteboard uit tot een verslag van de bijeenkomst? Dan heb je niet heel veel aan de nieuwe update in de OneDrive app voor iOS waarmee je nu rechtstreeks documenten, whiteboards en visitekaartjes kunt inscannen en opslaan. Maar voor alle anderen leg ik uit hoe dit werkt. Wat zijn de mogelijkheden en beperkingen? En hoe zorg je er voor dat het ingescande later ook weer goed terug kunt vinden?

Scannen met een app

De tijd dat je per se een A4 scanner naast of bij je computer moest hebben om documenten te digitaliseren is al lang voorbij natuurlijk. Telefoons en tablets hebben tegenwoordig uitstekende ingebouwde camera’s en, ongeacht het besturingssysteem, zijn er diverse apps beschikbaar waarmee je snel een document of visitekaartje kunt inscannen naar een jpg of pdf bestand. CamScanner is een goed voorbeeld voor Android, net als de Google Drive app voor Android die over scanfunctionaliteiten beschikt en natuurlijk alle ingescande bestanden daar opslaat. Voor iOS heb je o.a. Scanner Pro en zelf maak ik veel gebruik van Office Lens die voor zowel iOS, Android als Windows 10 Mobile beschikbaar is.

De scan-apps verschillen onderling niet enorm qua functionaliteiten. Allemaal nemen ze een foto van het in te scannen document (of whiteboard), gooien daar (wel of niet) bewerkingsslagen en optical character recognition – techniek om afbeeldingen om te zetten naar doorzoekbare tekst – overheen en slaan het vervolgens als bestand op.

Maar waar sla je al die bestanden op? Hoe beheer je ze en – nog belangrijker – hoe zorg je er voor dat je ook daadwerkelijk die bestanden terug kunt vinden?

OneDrive

Je hebt veel keuze als je alle ingescande brieven, rekeningen, visitekaartjes en whiteboards op één plek bij elkaar wilt bewaren en doorzoeken. Je kunt ze bijvoorbeeld allemaal in Evernote opslaan (ook de Evernote app kan ze inscannen) maar dat werkt alleen goed als je een betaald abonnement hebt. OneNote is een prima alternatief in combinatie met de Office Lens apps en dat geldt ook voor Google Drive die via de eigen apps eveneens een scanfunctie aanbiedt en alle ingescande documenten gratis doorzoekbaar maakt.

Persoonlijk geef ik echter de voorkeur aan OneDrive. Ik vind het fijner werken dan Google Drive – vooral met foto’s – en ik ben dol op de steeds beter wordende zoekfunctionaliteiten. Ik gebruik de zoekfunctie van OneDrive sowieso al voor het terugvinden van Office documenten, foto’s en aantekeningen in OneNote notitieboeken. En het was al de plek waar ik de met Office Lens, CamScanner of Scanner Pro ingescande documenten opsloeg omdat OneDrive die bestanden prima doorzoekbaar maakt.

Maar nu ook rechtstreeks vanuit de OneDrive app

Afgelopen week integreerde Microsoft (een deel van) de functionaliteiten van Office Lens in de OneDrive app zelf. Tenminste, voor iOS want hoewel de Android versie al langer een scanfunctie heeft is dat niet meer dan het maken van een foto die doorzoekbaar gemaakt en automatisch geupload wordt.

In de iOS app navigeer je eerst naar de map waar je de scan wilt opslaan, klik je op het plus-teken en krijg je de Office Lens interface voor het scannen:

De app probeert zelf al te bepalen of je een visitekaartje, document of whiteboard probeert te scannen maar dat kun je in het menu onderin eventueel corrigeren. In plaats van alleen een foto te maken probeert de app ook nog eens automatisch alles buiten te sluiten dat niet bij het visitekaartje, document of whiteboard hoort. Er verschijnt een selectie rondom het te scannen document en dat wordt gebruikt om de gemaakte scan te croppen zodat je alleen het document over houdt. Druk je vervolgens op de blauwe knop dan wordt het document als PDF-bestand geupload naar de map in kwestie en krijgt het een standaardnaam gebaseerd op de datum en tijdstip van de scan.

Wil je de gemaakte scan nog bewerken door bijvoorbeeld de afbeelding te draaien of zelf bij te snijden? Of wil je meerdere scans maken en deze als één bestand opslaan? Dan zul je alsnog de Office Lens app of een andere app moeten gebruiken want deze extra’s zitten (nog?) niet in de OneDrive app.

Beter terugvindbaar maken

De scans worden door OneDrive zelf al zo veel mogelijk doorzoekbaar gemaakt. Als je documenten met tekst scant dan kun je ze terugvinden op alle woorden die in dat document voorkomen. En dat geldt ook voor visitekaartjes natuurlijk. OneDrive kan zelfs goed overweg met geschreven tekst op whiteboards zodat je meestal de foto’s terugvindt van whiteboards als je op een term zoekt die je er met hanepoten op geschreven hebt.

Maar hoewel dat vaak verrassend goed werkt is het geen wondermiddel om ook alles perfect terug te kunnen vinden. Zo zijn bedrijfsnamen op visitekaartjes vaak als logo’s weergegeven en kan een zoekfunctie daar lang niet altijd chocola van maken. Of komen termen die je zou (willen) gebruiken om een document terug te vinden helemaal niet voor in het document zelf. Of heb jij (of een collega) toevallig een dermate slecht handschrift dat daar ook geen kruid tegenop gewassen is om het doorzoekbaar te maken.

De oplossing voor dit probleem is eenvoudig. Als je een scan maakt, kijk dan of meteen of de termen waar je het later op terug wilt kunnen vinden al in het bestand zelf voorkomen. Zo niet, voeg deze dan zelf toe aan de metadata. Wijzig bijvoorbeeld de bestandsnamen zodat ze beschrijven wat er in het document staat en maak gebruik van de mogelijkheid om een beschrijving (description) te maken van een bestand in de webversie van OneDrive. De naam van het bedrijf bijvoorbeeld bij visitekaartjes of het onderwerp waarover je die persoon gesproken hebt toen je dat visitekaartje kreeg.

Alles wat je in die beschrijving zet kan snel teruggevonden worden door de zoekfunctie van OneDrive. Je kunt de beschrijving dus ook gebruiken om bepaalde termen in op te nemen waar je later gemakkelijk in één keer alle relevante scans mee terug kunt vinden. Ik voeg bijvoorbeeld de term belastingaangifte toe aan alle bestanden die ik nodig heb voor de jaarlijkse aangifte en #controleren om voorlopige beschikkingen en aangiftes achteraf te controleren als ik de definitieve versies binnen heb.

Geef toe, dat is toch veel handiger dan alles in ordners of archiefdozen te bewaren?

#

  • © 2006- 2021 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top