Archiveer je blogposts bij de Wayback Machine

Enkele maanden geleden schreef ik over het voorkomen van linkrot op je blog door permanent werkende links te maken als je verwijst naar externe websites. Hierbij archiveer je andermans webpagina’s in o.a. de Wayback Machine zodat je er naar kunt verwijzen zonder bang te zijn dat de originele pagina’s veranderen of zelfs compleet verdwijnen. Maar andersom is dat natuurlijk net zo handig. Met de WordPress plugin van de Wayback Machine zorg je ervoor dat je eigen blogposts automatisch gearchiveerd worden en voor de eeuwigheid (?) veilig bewaard worden.

Wayback Machine

wayback machine savepagenow linkrot
De Wayback Machine maakt onderdeel uit van The Internet Archive die als doel heeft om zo’n beetje het hele internet te archiveren. Elke week worden er bijna een miljard webpagina’s als ‘snapshot’ bewaard waarbij de pagina’s – zoals ze er op dat moment uit zien – permanent gearchiveerd en daarna opgevraagd kunnen worden. Daar wordt een webcrawler voor gebruikt die het hele internet afstruint en niet alleen op zoek is naar nieuwe pagina’s maar ook kijkt welke bestaande (en al gearchiveerde) pagina’s gewijzigd zijn zodat er een nieuw snapshot gemaakt kan worden.

De Wayback Machine bewaart dus niet alleen losse webpagina’s maar houdt daar dus ook verschillende versies van bij die op een tijdlijn gepresenteerd worden. Op die manier kun je zowel eenvoudig kijken welke versie van een webpagina er gearchiveerd is maar ook alle wijzigingen van die pagina bekijken die er de afgelopen jaren zijn geweest. Mits die pagina natuurlijk ook al die tijd gearchiveerd is door de Wayback Machine.

wayback machine vakblog

In mijn geval zie je dat de voorpagina van Vakblog voor het eerst op 24 maart 2008 is gearchiveerd maar dat de webcrawler maar enkele keren in 2008, 2009 en 2010 voorbij is gekomen. In 2011, toen ik begon met dagelijks bloggen, is die frequentie enorm toegenomen omdat de Wayback Machine – net als Google – voorrang geeft aan sites die met regelmaat bijgewerkt worden. De voorpagina van een blog is daar een goed voorbeeld van.

Handmatig?

Maar ja, er zijn miljoenen blogs op het internet te vinden en het is maar de vraag of de Wayback Machine jouw blog uit zichzelf weet te vinden. Gelukkig kun je ook handmatig zelf een snapshot laten maken van een webpagina door op de voorpagina van de site een URL in te vullen bij Save Page Now.

Dat is leuk om te doen voor de voorpagina van je blog maar wordt pas echt nuttig als je de individuele blogposts gaat archiveren. De Wayback Machine archiveert namelijk niet automatisch je gehele blog als je de URL van je blog invult maar slechts de voorpagina. Wil je dus zorgen dat je blogposts permanent opgenomen worden in het gigantische webarchief, dan zul je ze één voor één moeten laten archiveren.

Waarom zou je je blogposts willen archiveren in de Wayback Machine? Behalve dat daarmee jouw blogposts permanent beschikbaar blijven, ook al zou je blog ooit verdwijnen, zijn er ook plannen van The Internet Archive om een Wayback Machine zoekmachine te ontwikkelen waarmee ook op inhoud gezocht kan worden in het webarchief. Mozilla en The Internet Archive zijn ook gezamenlijk bezig met een functie in de Firefox browser waarbij er automatisch gezocht wordt in de Wayback Machine als een site (in Google) niet meer te vinden is. En persoonlijk vind ik het een leuk idee dat mijn blogposts wellicht over 50 jaar nog gevonden kunnen worden, ver nadat zowel mijn blog als ikzelf er niet meer zijn. Tenzij ik 93 word en nog steeds aan het bloggen ben. Oef.

Geautomatiseerd in WordPress met de Archiver plugin

Gelukkig hoef je niet elke nieuwe blogpost handmatig toe te voegen aan de Wayback Machine als je gebruik maakt van WordPress. Er is een plugin – Archiver – beschikbaar die geheel automatisch een snapshot laat maken door de Wayback Machine op het moment dat je iets aan je blog wijzigt. Bijvoorbeeld als je een nieuwe blogpost of pagina publiceert maar ook als je een bestaande post of pagina aanpast.

Na installatie van de Archiver plugin – er zijn geen verdere instellingen nodig die je hoeft in te vullen – wordt de URL van elke nieuwe blogpost of pagina automatisch doorgegeven aan de Wayback Machine.

wayback machine
In de editor is er een nieuwe Archives metabox in de rechterkolom bijgekomen waar je – na het publiceren van de post – kunt zien welke snapshots van die post gemaakt zijn en kun je doorklikken naar de archiefpagina op de site van de Wayback Machine. In de menubalk van de admingebruiker (dat zal je zelf zijn als het goed is) is er ook een menu-optie Archiver bijgekomen die eveneens laat zien hoeveel snapshots er zijn van de post maar daarnaast ook de optie biedt om handmatig een nieuw snapshot te laten maken.

Als je ingelogd bent zie je de admin-menubalk ook op de voorpagina van je blog(post) en kun je dus ook daar zien hoeveel snapshots er van die pagina al gemaakt zijn.

wayback machine vakblog_front

Ik ben benieuwd of de gearchiveerde review van de Kobo Aura ONE in 2066 nog steeds gelezen kan worden ;)

@header afbeelding via Pixabay met CC0-verklaring

#

Simpel notities (en ideeën) bijhouden in Simplenote

Je kunt heel ingewikkelde oplossingen zoeken om hele eenvoudige dingen te doen. Ik bewaar artikelen die ik later nog wil lezen (of waar ik over wil bloggen) in Pocket. Aantekeningen en notities die ik voor mijn werk maak stop ik in Evernote OneNote en als ik snel even iets wil noteren – dat niet lang bewaard hoeft te worden – dan schrijf ik het snel op in een klein tekstbestandje (Kladblok!) en bewaar ik dat in OneDrive zodat ik het overal bij de hand heb.

Maar kan dat niet eenvoudiger?

Voor sommige dingen is OneNote eigenlijk iets te veel van het goede. “Eventjes” een snelle notitie maken omdat je een idee krijgt om over te bloggen wordt lastig als je eerst OneNote moet starten en moet wachten tot de geopende notitieboeken allemaal gesynchroniseerd zijn. Het zal vast aan mij liggen maar tegen de tijd dat ik het goede notitieboek en correcte tabblad gevonden heb, ben ik het idee al zowat vergeten. Ik wil iets dat eenvoudiger is, sneller is en nog steeds te gebruiken is op alle computers en mobiele apparaten waar ik mee werk. En waar nog steeds een beetje structuur in aan te brengen is.

Simplenote

Er zijn tientallen (gratis) programmaatjes waar je notities mee kunt maken maar Simplenote sprong er voor mij uit. Het is van Automattic, de makers van WordPress, is gratis en is beschikbaar in een webversie maar ook te downloaden voor Windows, Mac, Linux, iOS en Android.

simplenote newnote

Zoals je zou verwachten is het werken met Simplenote eenvoudig: na het aanmaken van een account kun je in alle versies van het programma snel een notitie toevoegen door op het icoontje te klikken van een blaadje met een + teken. Er verschijnt een leeg vel in de rechterkolom en daar kun je gewoon gaan tikken. Het wordt meteen opgeslagen. De eerste regel wordt als de titel van de notitie beschouwd en duikt op in de linkerkolom zodat je het later terug kunt vinden.

Zo simpel is het.

Heb je al tientallen of honderden notities gemaakt en raak je het overzicht een beetje kwijt? Geen punt want in het zoekbalkje bovenin kun je alle notities full-text doorzoeken om ze op die manier meteen terug te vinden. En wil je toch wat meer structuur aanbrengen in je notities? Dat kan door onder je notitie één of meerdere tags toe te voegen die je later – links van het zoekbalkje – kunt gebruiken om al je notities op te filteren. Alle ideetjes voor een toekomstige blogpost geef ik een tag ‘vakblog’ bijvoorbeeld terwijl ik alle lijstjes van een gelijknamige tag voorzie.

Het werkt razendsnel en alles is meteen beschikbaar op mijn iPad, telefoon en computer. Wat wil je nog meer?

Toch iets minder simpel maken?

Hoe eenvoudiger een programma is, hoe minder mogelijkheden het waarschijnlijk heeft en dat is bij Simplenote ook het geval. Je bent dus beperkt tot één lange lijst met notities die je alleen met tags wat overzichtelijker kunt maken en de notities zijn in platte tekst zodat je geen opmaak kunt toepassen. Geen vet, cursief of opsommingstekens bijvoorbeeld.

Maar Simplenote ondersteunt echter ook de opmaaktaal markdown, ook al zit het expres een beetje verstopt in het programma. Markdown is een set aan leestekens die je in combinatie met tekst kunt gebruiken om in platte tekst de tekst op te maken met HTML. Die leestekens zorgen er voor dat tijdens het exporteren van een platte tekst er automatisch bijbehorende HTML tags worden toegevoegd. Een hashteken (#) voor een regel zorgt er bijvoorbeeld voor dat het gelezen wordt als een H1 header, een asterisk (*) dat de tekst vet wordt gemaakt, twee asterisken (**) dat de tekst cursief getoond wordt en een groter-dan-teken (>) levert een blockquote op. Een volledige lijst met markdown tekens kun je hier vinden.

simplenote markdown

Markdown staat standaard uit en je moet het aanzetten bij Settings -> Writing door het schuifje Enable Markdown om te gooien. Zelfs dan moet je het nog steeds per notitie expliciet aanzetten door in de notitie rechtsbovenaan op het rondje met de i te klikken (info) en daar ook een schuifje te activeren voor markdown.

Als het gelukt is krijg je een klein balkje bovenin de notitie te zien met Edit/Preview waarmee je kunt wisselen tussen de platte-tekst weergave die je kunt bewerken en de weergave met de opmaak.

simplenote

Dat maakt het dus mogelijk om (o.a.) blogposts in Simplenote zelf al op te maken. Hierboven zie je een blogpost die ik eerder deze week gepubliceerd heb en die ik volledig opgemaakt heb met behulp van markdown. Met behulp van de Preview knop kun je precies zien hoe het er uit komt te zien en daar kun je ook meteen alles kopiëren zodat je het kunt plakken in WordPress. Heel handig als je ook offline je blogposts wilt voorbereiden.

#

Iemand heeft een DMCA verwijderverzoek bij Google gedaan voor jouw site. Wat nu?

Het is één ding om te lezen over een Amerikaanse blogger die een verwijderverzoek van een rechthebbende aan zijn broek krijgt en ineens moet aantonen dat zijn blog helemaal geen inbreuk maakt maar het is heel wat anders als je zo’n verwijderverzoek krijgt als Nederlandse blogger. Wat houdt zo’n verwijderverzoek van rechthebbenden aan Google nou precies in? En wat kun/moet je doen als het jou overkomt?

Digital Millennium Copyright Act (DMCA)

In Amerika is er natuurlijk ook auteursrechtwetgeving. In 1998 werd de bestaande wetgeving uitgebreid met de Digital Millennium Copyright Act (PDF) met het doel de auteursrechtwetgeving klaar te maken voor het nieuwe millennium en het digitale/online tijdperk. Het introduceerde o.a. de mogelijkheid voor rechthebbenden om inbreuken op het auteursrecht die online plaatsvinden, aan te kunnen pakken. Het verhoogde ook nog eens de (Amerikaanse) strafmaat voor dat soort inbreuken terwijl tegelijkertijd de aansprakelijkheid van providers verminderd werd.

Op basis van de DMCA kunnen rechthebbenden een zogenaamde takedown notice of removal notice afgeven bij websites als ze menen dat een site inbreuk pleegt op hun intellectuele eigendomsrechten. Het is dan in het belang van de site om daar gehoor aan te geven – en het inbreukmakende materiaal te verwijderen – omdat daarmee ook de aansprakelijkheid verdwijnt.

Die theorie was prima maar in de praktijk ging het toch net wat anders. Hoewel de DMCA er dus op gericht is om zowel rechthebbenden als site-eigenaren opties te geven correct met auteursrechtelijk beschermd materiaal om te gaan, gaat het op internet niet zo zeer over de vraag of er inbreukmakend materiaal op een site te vinden is maar over de vraag hoe dat materiaal gevonden wordt.

En het antwoord op die vraag is Google.

Met Google vind je ook inbreukmakend materiaal terug

Sinds 2011 biedt Google rechthebbenden de mogelijkheid om een verwijderverzoek in te dienen op basis van de DMCA waarmee vermeende inbreukmakende url’s verwijderd worden uit de zoekresultaten van Google. Eind 2011 ontving Google elke week “slechts” tienduizenden van dit soort verwijderverzoeken maar film- en tvmaatschappijen, uitgevers, platenlabels, overheden en alle overige rechthebbenden zijn helemaal los gegaan en vragen Google nu wekelijks om ruim 20 miljoen url’s te verwijderen. Afgelopen maand waren het er zelfs meer dan 88 miljoen in totaal.

dmca verwijderverzoek

Dat rechthebbenden echt niet elke week 20 miljoen url’s nalopen om te verifiëren dat er ook echt inbreuk wordt gemaakt op hun rechten zal duidelijk zijn. De afgelopen jaren zijn er tientallen voorbeelden in de media gekomen van onterechte verwijderverzoeken waarbij rechthebbenden soms hun eigen sites doorgaven en in veel gevallen een verzoek indienden om legale content te laten verwijderen uit de zoekresultaten van Google. Of url’s waar helemaal geen sprake was van het materiaal waar rechthebbenden van meenden dat het van hun was.

De reden hiervoor is dat er helemaal geen mens aan te pas komt. Er zijn bedrijven die voor rechthebbenden met een bot het internet afzoeken (googelen natuurlijk) en simpelweg alle url’s inventariseren die hoog terugkomen in de zoekresultaten of waarschijnlijk linken naar een illegale download. Doordat het woord torrent er bijvoorbeeld in voorkomt. Het is niet voor niets dat slechts 10 sites tezamen al verantwoordelijk waren voor 70 miljoen verwijderverzoeken het afgelopen jaar. Zo’n beetje alle links op die sites komen automatisch terecht op de verwijderverzoeken van rechthebbenden.

Maar wat als jouw site daar ook ineens tussen zit?

Bij geautomatiseerde zoekacties naar vermeende inbreukmakende url’s is de kans niet zo heel groot dat er url’s van jouw site tussen zitten. Het gaat om Amerikaanse wetgeving, Amerikaans materiaal en de bots focussen zich vooral op de grote en bekende aanbieders van illegaal materiaal.

Maar als je wel degelijk linkt naar illegaal materiaal of simpelweg goed scoort in Google op de zoekopdrachten die dat soort bots uitvoeren, dan is het zeker niet uitgesloten dat je als Nederlandse site of blog ineens opduikt in de verwijderverzoeken van een rechthebbende aan Google.

Dat overkwam mij dus vanochtend.

dmca verwijderverzoek

Ik kreeg een mailtje van Google dat twee url’s van Vakblog uit de zoekresultaten van Google gehaald gaan worden omdat een rechthebbende die op een lijst van vermeende inbreuken had gezet. Gelukkig werd er verwezen naar het betreffende verwijderverzoek en kon ik achterhalen om welke rechthebbende het ging.

dmca airawakens verwijderverzoek

Beide url’s verwijzen naar dezelfde blogpost van eind 2015 waarin ik over in 2015 gelezen favoriete boeken schreef. Daar vermeldde ik ook de Air Awakens serie van Elise Kova (in 90 woorden) en verwees ik naar de Amazon.nl pagina waar ik zelf het boek gekocht had.

Dat mijn blogpost nu voorkomt op een lijst van 420 url’s die door Silver Wing Press, de uitgever van de boeken, aan Google is doorgegeven is raar. Heel raar. Vooral omdat mijn blog ineens tussen de torrent- en downloadsites staat terwijl er geen downloadlink te vinden is in het artikel op mijn blog en ik verwijs naar de Amazon pagina.

En wat nu?

Je kunt er voor kiezen om niets te doen natuurlijk. Afhankelijk van of je daadwerkelijk verwijst naar inbreukmakend materiaal en hoe “belangrijk” die url’s zijn voor je site of blog ga je maar weinig merken van het verdwijnen van een paar url’s uit de zoekresultaten van Google.

Maar als je er niet van gediend bent dat je site/blog onterecht geassocieerd wordt met een inbreuk op het auteursrecht – helemaal als je over auteursrecht schrijft – dan voorziet de DMCA ook in een verplichte mogelijkheid om bezwaar aan te tekenen tegen dit soort verwijderverzoeken. Google verwijst er ook meteen naar in de mail die ze je sturen:

If you feel that your sites or pages were mistakenly removed due to a DMCA request filed against you, Google can reinstate these materials into our search results upon receipt of a DMCA Counter Notification.

Laat het Google weten!

Je kunt dus een DMCA Counter Notification invullen waarin je aangeeft dat het verwijderverzoek onterecht is. Je kunt aangeven welke situatie op jouw geval van toepassing is en je verklaart dat jij je aan de wet gehouden hebt.

Rechthebbenden die waslijsten met url’s indienen bij Google maken zich per definitie niet heel erg druk over wat jij er als onschuldige site-eigenaar van vindt. Helaas gebruikt ook Google vervolgens het piepsysteem waarin eigenaren van blogs of websites zelf aan de bel moeten trekken als ze onterecht op zo’n lijst voor komen. Ik raad iedereen met klem aan om een counter notification in te dienen als het jou overkomt. Bij een piepsysteem moet je zorgen dat je flink piept.

DMCA Counter Notification na verwijderverzoek

Laat het de rechthebbenden en/of makers weten!

Ongeacht of Google het verwijderverzoek voor url’s van jouw site of blog ongedaan maakt, zou ik je aanraden om ook contact op te nemen met de rechthebbende zelf. Dat die een bedrijf in de arm heeft genomen om bij Google honderden of duizenden geautomatiseerde verwijderverzoeken in te dienen zonder zelf te controleren of het ook echt om inbreuken gaat, is al erg genoeg.

Neem de tijd en moeite om te ze te laten weten dat ze daarmee ook mensen benadelen die nu minder genegen zullen zijn om hun producten af te nemen. Wie weet denken ze in de toekomst twee keer na voordat ze hun naam laten zetten onder een lijst met url’s?

En dat geldt ook voor de makers van het werk zelf die in alle waarschijnlijkheid niet eens weten dat hun uitgever, platenmaatschappij of filmmaatschappij ook sites van fans op dit soort lijsten zetten. Zo heb ik schrijfster Elise Kova, die ik al jaren volg op Twitter, laten weten dat haar uitgever mijn blogpost met een DMCA verwijderverzoek uit Google wil halen. En dat voor een aanbeveling van haar boeken met link naar de site waar ze verkocht worden.

Rechthebbenden mogen vanzelfsprekend hun auteursrecht handhaven maar jij en ik mogen ook verwachten dat dit zorgvuldig en weloverwogen gebeurt. Dat is bij verwijderverzoeken aan Google zeker niet altijd het geval en het is dan aan jou om actie te ondernemen als jouw url’s verwijderd dreigen te worden.

Update 9-8-2016: Ik kreeg via een DM op Twitter excuses van Elise die ook nog toelichtte dat de uitgever haar eigen bedrijf is waaronder ze haar boeken publiceert in Amerika. Ze bleek inderdaad een dienst af te nemen die links naar illegale versies van haar boeken doorgeeft aan Google en baalde behoorlijk dat er per ongeluk een blogger tussen zat. De DMCA claims naar beide url’s zijn meteen door haar ingetrokken en ik neem aan dat daarmee ook voor Google de zaak afgehandeld is. En ik ga nog steeds haar volgende boek kopen ;)

#

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top