dode links header

Dode links in ebooks opsporen en repareren met behulp van Calibre

Dode links heb je niet alleen op websites maar kunnen ook in ebooks voorkomen. Met de Broken link checker van Calibre kun je deze dode links in ebooks opsporen en (handmatig) repareren met behulp van o.a. Google en The Wayback Machine.

Als je op een website met een linkje verwijst naar een andere website dan loop je het risico dat deze na verloop van tijd niet meer werkt. Webpagina’s worden verplaatst, verwijderd of komen achter een betaalmuur terecht waardoor de gevreesde 404 Not Found melding te voorschijn komt. Het is enorm veel werk om deze dode links op te sporen – ik spreek uit ervaring – en dat is de reden waarom ik linkrot tegenwoordig liever probeer te voorkomen op dit blog.

Maar dode links komen (helaas) niet alleen voor op websites. Ook in (non-fictie) ebooks wordt vaak gebruik gemaakt van links naar websites en online documenten als achtergrondinformatie bij de onderwerpen die besproken worden. Idealiter houdt een auteur of uitgever rekening met het feit dat deze links eigenlijk duurzaam moeten zijn – door ze te archiveren in The Wayback Machine of Perma.cc – maar in de praktijk zal dat maar zelden het geval zijn.

Ik liep er tegen aan in het exemplaar van ‘The End of Ownership‘ dat ik in november 2016 kocht. Een uitstekend boek maar toen ik het recentelijk opnieuw aan het doorspitten was viel me op dat meerdere links niet meer werkten. Ik ging op zoek naar een tooltje waarmee je dode links kunt opsporen, zoals die er ook voor websites zijn, en vond die – goed verstopt – in Calibre terug.

Dode links opsporen in Calibre

Sinds december 2013 beschikt Calibre over een eigen ebook-editor om ebooks te kunnen bewerken die in de bibliotheek staan. Het is een bijzonder handige tool om handmatig een ebook te repareren of aan te passen maar het kan ook een aantal dingen automatisch doen.

Zorg er dus eerst voor dat je het boek importeert in de Calibre bibliotheek en klik vervolgens op de menuknop Edit book om het in de editor te openen.

dode links ebooks calibre

De editor is een los programma en heeft zijn eigen menu. Onder Tools vind je daar een kopje External links en kun je vervolgens klikken op Check external links.

Calibre gaat vervolgens alle hyperlinks die naar webpagina’s of andere locaties buiten het ebook leiden controleren.

dode links ebooks calibre

Afhankelijk van hoeveel links er in het boek zitten duurt dat even maar na een tijdje krijg je een overzicht van links die niet rechtstreeks te openen zijn.

dode links ebooks calibre

In het geval van ‘The End of Ownership’ kreeg ik 26 links terug die een foutmelding opleverden. Je kunt klikken op het line number [1] om te zien waar in de tekst de link terug te vinden is – handig als je iets meer informatie nodig hebt om met behulp van Google een nieuwe link op te sporen – maar je kunt ook gelijk klikken op Fix this link [2] om de nieuwe URL op te geven. In het ebook wordt dan vervolgens de nieuwe link gebruikt.

Er is niet echt een stappenplan te maken van hoe je een (eventuele) gecorrigeerde link op het spoor komt maar je kunt het beste beginnen met de link zelf te kopiëren en te plakken in de browser (of Google) om te kijken of je een doorverwijzing vindt. Maar ook om vast te stellen of de link ook echt wel dood is want als er een cookie melding op een site staat dan zal de linkchecker het ook als een foutmelding terug krijgen.
Werkt de link wel gewoon? Vul dan de link gewoon opnieuw in bij Fix this link om het uit het lijstje met dode links te halen.

Link 1 bleek bijvoorbeeld nu een nieuwe URL-structuur te hebben omdat rechtspraak.nl vorig jaar de site vernieuwd heeft.

dode links ebooks calibre

Link 2 was echter van het internet verdwenen want de site shelffree.org.uk bestaat inmiddels niet meer. Een goede oplossing is dan om de link op te zoeken in The Wayback Machine die miljarden webpagina’s periodiek archiveert. En jawel, ook deze link bleek een maand nadat de blogpost gepubliceerd is gearchiveerd te zijn. Door op Fix this link te klikken kun je dan de (werkende) link ter vervanging van de bestaande opgeven.

dode links ebooks calibre

Documenten of webpagina’s die naar een (iets) andere URL zijn verplaatst komen ook veel voor en daar helpt het om de naam van het bestand – de pdf in dit geval – gewoon via Google op te zoeken. In dit geval bleek een sub(sub)domein geschrapt te zijn uit de URL.

En dit zul je uiteindelijk voor elke afzonderlijke link moeten gaan uitzoeken. Waarom werkt de link niet meer en is er een nieuwe link die nu gebruikt kan worden? Of dit al het werk waard is zul je voor jezelf moeten bepalen natuurlijk maar het is wel goed dat je tenminste de mogelijkheid hebt om de dode links in ebooks te repareren.

#

calibre header

Tonen van ebookformaten in de bibliotheek in Calibre

Adelheid vroeg: Is het ook mogelijk om een kolom te maken waarin de extensie van een boek zichtbaar is? Bv. als ik dubbele heb wil ik graag zien of het een .epub, .mobi of .pdf is. Anders moet ik ze beide openen om dat te zien.

Meerdere formaten

Calibre kan overweg met ongeveer elk ebookformaat dat er bestaat. Er zijn tientallen formaten (extensies) die voor kunnen komen en het grote voordeel van Calibre is nou net dat het heel weinig uitmaakt in welk formaat je een ebook hebt: ze worden namelijk automatisch geconverteerd naar het correcte formaat als je ze naar je ereader stuurt.

Heb je alleen maar EPUB boeken dan worden ze automatisch naar AZW3 of MOBI geconverteerd als je een Kindle gebruikt en dat gebeurt andersom ook als je Kindle ebooks in je bibliotheek hebt staan die je naar een Kobo ereader stuurt. Mits er geen DRM op zit natuurlijk.

Nu zullen de meeste gebruikers van Calibre geen tientallen verschillende ebookformaten in hun bibliotheek hebben staan. Sterker nog, de meesten zullen er maar één of twee hebben omdat in Nederland EPUB de standaard is. Dat is ook de reden dat Calibre weliswaar bij de metadata van een ebook toont in welk formaat (of welke formaten) een titel is maar het niet getoond wordt in de kolommen van een standaardbibliotheek. Het voegt erg weinig toe om 100 keer EPUB te zien staan natuurlijk.

Dat wil niet zeggen dat het voor iedereen geldt. Zelf koop ik ook veel ebooks bij Amazon en mijn Calibre bibliotheek is dan ook een mix van EPUB en AZW3/MOBI ebooks. Ja, Calibre converteert automatisch de ebooks zodat het niet uitmaakt of ik een Kindle, Tolino of een Kobo ereader gebruik op dat moment maar ik vind het nog steeds handig om meteen te kunnen zien of het een titel is die ik bij Bol/Kobo gekocht heb of eentje die ik bij Amazon gekocht heb.

Ebookformaten tonen in de bibliotheek

In Calibre is een bibliotheek ‘ingericht’ met een aantal kolommen waarin de metadata opgenomen is. Standaard krijg je de kolommen te zien voor titel, auteur, datum, grootte (MB), waardering, labels, reeksen, uitgever en gepubliceerd. Twee extra kolommen, gewijzigd en talen, zijn verborgen en kun je ook gebruiken als je wilt.

Behalve deze standaardkolommen kun je ook eigen kolommen aanmaken. Daar kun je zelf mee knutselen maar Calibre heeft ook alvast een paar voorbeelden ingebouwd en (niet toevallig) daar zit ook de optie bij om een aangepaste kolom voor de formaten te maken.

Stap 1. Ga naar Voorkeuren en kies in de bovenste rij voor Voeg eigen kolommen toe


gelezen markeren calibre

Stap 2. Klik op het icoontje met het groene plus-teken om een nieuwe aangepaste kolom te maken

ebookformaten calibre

Stap 3. Configureer de nieuwe aangepaste kolom

ebookformaten calibre
Normaliter moet je dit allemaal zelf configureren maar zoals ik al schreef heeft Calibre ook een paar ingebouwde voorbeelden die je achter Snel aanmaken terugvindt. Je ziet daar Formaten staan en als je daar op klikt worden de velden eronder automatisch ingevuld.

ebookformaten calibre
Je hoeft hier verder niets aan te veranderen (al kun je bij Koptekst van kolom de naam veranderen zoals die in de bibliotheek gebruikt gaat worden als je liever ‘extensie’ of ‘type’ wilt hebben). Klik op OK om de nieuwe kolom aan te maken.

Stap 4. Even opnieuw opstarten

ebookformaten calibre

En na het opnieuw opstarten van Calibre is de nieuwe ‘formaten’ kolom meteen toegevoegd aan je bibliotheek!

ebookformaten calibre

#

Vergelijken van twee Calibre bibliotheken en ontdubbelen

Eén van de manieren om je ebooks overzichtelijk in te delen in Calibre is door ze op te splitsen in meerdere bibliotheken. Maar tenzij je dat heel consequent en weloverwogen doet is het daarmee ook gemakkelijk om dubbele titels in meerdere bibliotheken te krijgen. En dat is natuurlijk niet de bedoeling. Gelukkig kun je met behulp van de Find Duplicates plugin twee bibliotheken met elkaar vergelijken en ontdubbelen van alle overlappende titels.

Hoe handig het ook is om je collectie ebooks in Calibre te beheren, je moet nog steeds zelf goed nadenken over de structuur van je bibliotheek. Ga je alles in één bibliotheek stoppen en met virtuele bibliotheken of extra kolommen ordenen? Of maak je meerdere bibliotheken aan om zo bijvoorbeeld de boeken per genre bij elkaar te houden?

Zelf kies ik het liefste voor één bibliotheek en heb ik alleen een extra bibliotheek om wat dingen in te testen die ik liever niet wil uitproberen op mijn ‘hoofdbibliotheek’. Maar een lezer van dit blog gaf aan dat hij twee bibliotheken gebruikte en dat er inmiddels wat overlap was ontstaan omdat bepaalde titels in beide bibliotheken zitten. En vroeg of het mogelijk was deze dubbele titels er op een handige manier uit te halen.

Ontdubbelen

De beste manier van ontdubbelen is natuurlijk om te zorgen dat het simpelweg niet nodig is omdat je duidelijk gescheiden hebt welke (soort) boeken in de ene en welke in de andere moeten komen. Bijvoorbeeld door ebooks in één bibliotheek te zetten en de digitale stripboeken in een andere.

Doe je dat niet en krijg je toch overlappende titels? Dan wordt het meteen al wat lastiger omdat Calibre niet twee bibliotheken tegelijk kan openen en je dus niet even gemakkelijk tussen beide kunt alt-tabben om ze met elkaar te vergelijken. Je zou een portable versie van Calibre kunnen installeren op een usbstick of externe harde schijf en op die manier twee keer Calibre naast elkaar kunnen draaien maar handig is dat bepaald niet.

Gelukkig is er voor de meeste dingen waar Calibre zelf niet in voorziet een plugin beschikbaar en dat is hier ook het geval. Met behulp van de Find Duplicates plugin kun je naar dubbele titels zoeken binnen een bibliotheek maar ook tussen twee verschillende bibliotheken.

Find Duplicates plugin installeren

Voordat je de ontdubbelfunctie kunt gebruiken moet je eerst de plugin installeren. Ga daarvoor naar Voorkeuren in de menubalk en vervolgens (helemaal linksonderin) naar Plug-ins in het deel Geavanceerd.

calibre ontdubbelen

In het scherm van de plugins kun je nieuwe plugins installeren door op Nieuwe plug-ins verkrijgen te klikken.

calibre ontdubbelen

Je krijgt nu een lange lijst te zien van alle plugins die (nog) niet geïnstalleerd zijn. Daar kun je doorheen scrollen tot je bij Find Duplicates komt maar het gaat sneller door rechtsbovenaan de lijst te filteren op de naam. ‘Dup’ is al meer dan genoeg. Selecteer Find Duplicates – zodat de regel blauw wordt – en klik vervolgens op Installeren.

calibre ontdubbelen

Je kunt nu kiezen waar de menuknop met de ontdubbelfunctie allemaal getoond moet worden. Standaard zijn de eerste twee werkbalken geselecteerd en dat is in principe ook voldoende. Find Duplicates wordt dan aan de hoofdwerkbalk toegevoegd van je bibliotheek en ook aan de hoofdwerkbalk als je een ereader hebt gekoppeld aan je pc.

Find Duplicates gebruiken

Als alles goed gegaan is dan heb je nu een nieuwe menuknop in de hoofdwerkbalk van Calibre erbij gekregen.

Nu wordt het even zaak om na te denken hoe je het ontdubbelen wilt aanpakken. Find Duplicates markeert namelijk eventuele dubbele titels altijd in de bibliotheek die op dat moment geopend is. Bedenk dus van te voren uit welke van de twee bibliotheken de dubbele titels verwijderd kunnen/mogen worden!

Heb je meer dan twee bibliotheken? Dan zul je het dus in meerdere stappen moeten doen omdat Find Duplicates slechts twee bibliotheken per keer met elkaar kan vergelijken. Bij drie bibliotheken is het dus verstandig om één van de bibliotheken als hoofdbibliotheek te bestempelen waar de dubbele titels dus juist mogen blijven staan. Open dan bibliotheek 2, vergelijk die met de hoofdbibliotheek (1) en verwijder dubbele titels uit twee. Vervolgens open je bibliotheek 3 en vergelijk je die ook met de hoofdbibliotheek (1).

Eventueel kun je ook nog 2 en 3 met elkaar vergelijken maar als je daar ook overlap in hebt zitten van titels die niet in de hoofdbibliotheek zitten, dan moet je toch even nadenken over de zooi die je gemaakt hebt ;)

Maar goed, zorg dus dat je de bibliotheek opent waar je eventuele dubbele titels in wilt/kunt verwijderen en klik dan op het pijltje naast de menuknop Find Duplicates.

calibre ontdubbelen

Klik je namelijk op de knop zelf dan zoekt Find Duplicates alleen maar dubbele titels binnen de bibliotheek die geopend is. In het menuutje naast de knop zie je echter de optie Find library duplicates (de plugin is niet vertaald naar het Nederlands). Klik deze aan om verder te gaan.

calibre ontdubbelen

Hier komen even wat opties op je af. Het allerbelangrijkste moet je bij [1] doen want daar kies je de bibliotheek waarmee de huidige geopende bibliotheek mee vergeleken moet worden. Je moet helaas met de knop van het mapje bladeren naar de map waarin die bibliotheek staat dus zorg dat je weet in welke map die tweede bibliotheek staat. Overigens onthoudt de plugin dat je deze bibliotheek geselecteerd hebt voor een volgende keer.

De plugin kan op meerdere metadatavelden de boeken in de beide bibliotheken met elkaar vergelijken [2]. De default optie is Title/Author maar je kunt ook kiezen voor Binary Compare (waarbij de daadwerkelijke ebookbestanden met elkaar vergeleken worden) of een andere identifier zoals het isbn, ASIN nummer enz. Die laatste werkt alleen als je heel zorgvuldig de metadata hebt aangevuld dus Title/Author is het verstandigste om te gebruiken hier.

Bij Title Matching [3] en Author Matching [4] kun je aangeven hoe strikt er op titel en auteur gezocht moet worden. Identical betekent dat het dus letterlijk identiek moet zijn en dat er geen punt of initiaal anders mag zijn. Similar negeert eventuele verschillen in interpunctie in zowel auteur- als titelvelden. Fuzzy doet hetzelfde voor auteursnamen maar is veel vergeeflijker bij titels vergelijken omdat dan ook de subtitel genegeerd wordt. Ignore tot slotte kun je slechts bij één van de beide velden invullen want het geeft aan dat ofwel de titel genegeerd moet worden en alleen op auteur vergeleken wordt danwel precies andersom.

Hier kun je mee spelen om de gevonden resultaten te beïnvloeden maar met Similar zou je de meeste dubbele titels moeten kunnen vinden als je ook de twee velden ingevuld hebt in je bibliotheken. Klik vervolgens op OK om de twee bibliotheken te doorzoeken.

calibre ontdubbelen

En als er dubbele titels zijn dan ga je daar een melding van krijgen. In mijn geval is het slechts 1 boek (en dat klopt want de testbibliotheek had maar 5 boeken met 1 overlappende titel) en kun je zien om welke boeken het gaat door op Toon details te klikken.

Klik je daarna op OK, dan kom je terug in het hoofdscherm van Calibre waar vervolgens alle gevonden dubbele boeken gemarkeerd en gefilterd zijn in de geopende bibliotheek. Je kunt ze dan eenvoudig allemaal selecteren en verwijderen zodat de boeken nog maar in één bibliotheek staan.

#

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top