Vergelijken van twee Calibre bibliotheken en ontdubbelen

Eén van de manieren om je ebooks overzichtelijk in te delen in Calibre is door ze op te splitsen in meerdere bibliotheken. Maar tenzij je dat heel consequent en weloverwogen doet is het daarmee ook gemakkelijk om dubbele titels in meerdere bibliotheken te krijgen. En dat is natuurlijk niet de bedoeling. Gelukkig kun je met behulp van de Find Duplicates plugin twee bibliotheken met elkaar vergelijken en ontdubbelen van alle overlappende titels.

Hoe handig het ook is om je collectie ebooks in Calibre te beheren, je moet nog steeds zelf goed nadenken over de structuur van je bibliotheek. Ga je alles in één bibliotheek stoppen en met virtuele bibliotheken of extra kolommen ordenen? Of maak je meerdere bibliotheken aan om zo bijvoorbeeld de boeken per genre bij elkaar te houden?

Zelf kies ik het liefste voor één bibliotheek en heb ik alleen een extra bibliotheek om wat dingen in te testen die ik liever niet wil uitproberen op mijn ‘hoofdbibliotheek’. Maar een lezer van dit blog gaf aan dat hij twee bibliotheken gebruikte en dat er inmiddels wat overlap was ontstaan omdat bepaalde titels in beide bibliotheken zitten. En vroeg of het mogelijk was deze dubbele titels er op een handige manier uit te halen.

Ontdubbelen

De beste manier van ontdubbelen is natuurlijk om te zorgen dat het simpelweg niet nodig is omdat je duidelijk gescheiden hebt welke (soort) boeken in de ene en welke in de andere moeten komen. Bijvoorbeeld door ebooks in één bibliotheek te zetten en de digitale stripboeken in een andere.

Doe je dat niet en krijg je toch overlappende titels? Dan wordt het meteen al wat lastiger omdat Calibre niet twee bibliotheken tegelijk kan openen en je dus niet even gemakkelijk tussen beide kunt alt-tabben om ze met elkaar te vergelijken. Je zou een portable versie van Calibre kunnen installeren op een usbstick of externe harde schijf en op die manier twee keer Calibre naast elkaar kunnen draaien maar handig is dat bepaald niet.

Gelukkig is er voor de meeste dingen waar Calibre zelf niet in voorziet een plugin beschikbaar en dat is hier ook het geval. Met behulp van de Find Duplicates plugin kun je naar dubbele titels zoeken binnen een bibliotheek maar ook tussen twee verschillende bibliotheken.

Find Duplicates plugin installeren

Voordat je de ontdubbelfunctie kunt gebruiken moet je eerst de plugin installeren. Ga daarvoor naar Voorkeuren in de menubalk en vervolgens (helemaal linksonderin) naar Plug-ins in het deel Geavanceerd.

calibre ontdubbelen

In het scherm van de plugins kun je nieuwe plugins installeren door op Nieuwe plug-ins verkrijgen te klikken.

calibre ontdubbelen

Je krijgt nu een lange lijst te zien van alle plugins die (nog) niet geïnstalleerd zijn. Daar kun je doorheen scrollen tot je bij Find Duplicates komt maar het gaat sneller door rechtsbovenaan de lijst te filteren op de naam. ‘Dup’ is al meer dan genoeg. Selecteer Find Duplicates – zodat de regel blauw wordt – en klik vervolgens op Installeren.

calibre ontdubbelen

Je kunt nu kiezen waar de menuknop met de ontdubbelfunctie allemaal getoond moet worden. Standaard zijn de eerste twee werkbalken geselecteerd en dat is in principe ook voldoende. Find Duplicates wordt dan aan de hoofdwerkbalk toegevoegd van je bibliotheek en ook aan de hoofdwerkbalk als je een ereader hebt gekoppeld aan je pc.

Find Duplicates gebruiken

Als alles goed gegaan is dan heb je nu een nieuwe menuknop in de hoofdwerkbalk van Calibre erbij gekregen.

Nu wordt het even zaak om na te denken hoe je het ontdubbelen wilt aanpakken. Find Duplicates markeert namelijk eventuele dubbele titels altijd in de bibliotheek die op dat moment geopend is. Bedenk dus van te voren uit welke van de twee bibliotheken de dubbele titels verwijderd kunnen/mogen worden!

Heb je meer dan twee bibliotheken? Dan zul je het dus in meerdere stappen moeten doen omdat Find Duplicates slechts twee bibliotheken per keer met elkaar kan vergelijken. Bij drie bibliotheken is het dus verstandig om één van de bibliotheken als hoofdbibliotheek te bestempelen waar de dubbele titels dus juist mogen blijven staan. Open dan bibliotheek 2, vergelijk die met de hoofdbibliotheek (1) en verwijder dubbele titels uit twee. Vervolgens open je bibliotheek 3 en vergelijk je die ook met de hoofdbibliotheek (1).

Eventueel kun je ook nog 2 en 3 met elkaar vergelijken maar als je daar ook overlap in hebt zitten van titels die niet in de hoofdbibliotheek zitten, dan moet je toch even nadenken over de zooi die je gemaakt hebt ;)

Maar goed, zorg dus dat je de bibliotheek opent waar je eventuele dubbele titels in wilt/kunt verwijderen en klik dan op het pijltje naast de menuknop Find Duplicates.

calibre ontdubbelen

Klik je namelijk op de knop zelf dan zoekt Find Duplicates alleen maar dubbele titels binnen de bibliotheek die geopend is. In het menuutje naast de knop zie je echter de optie Find library duplicates (de plugin is niet vertaald naar het Nederlands). Klik deze aan om verder te gaan.

calibre ontdubbelen

Hier komen even wat opties op je af. Het allerbelangrijkste moet je bij [1] doen want daar kies je de bibliotheek waarmee de huidige geopende bibliotheek mee vergeleken moet worden. Je moet helaas met de knop van het mapje bladeren naar de map waarin die bibliotheek staat dus zorg dat je weet in welke map die tweede bibliotheek staat. Overigens onthoudt de plugin dat je deze bibliotheek geselecteerd hebt voor een volgende keer.

De plugin kan op meerdere metadatavelden de boeken in de beide bibliotheken met elkaar vergelijken [2]. De default optie is Title/Author maar je kunt ook kiezen voor Binary Compare (waarbij de daadwerkelijke ebookbestanden met elkaar vergeleken worden) of een andere identifier zoals het isbn, ASIN nummer enz. Die laatste werkt alleen als je heel zorgvuldig de metadata hebt aangevuld dus Title/Author is het verstandigste om te gebruiken hier.

Bij Title Matching [3] en Author Matching [4] kun je aangeven hoe strikt er op titel en auteur gezocht moet worden. Identical betekent dat het dus letterlijk identiek moet zijn en dat er geen punt of initiaal anders mag zijn. Similar negeert eventuele verschillen in interpunctie in zowel auteur- als titelvelden. Fuzzy doet hetzelfde voor auteursnamen maar is veel vergeeflijker bij titels vergelijken omdat dan ook de subtitel genegeerd wordt. Ignore tot slotte kun je slechts bij één van de beide velden invullen want het geeft aan dat ofwel de titel genegeerd moet worden en alleen op auteur vergeleken wordt danwel precies andersom.

Hier kun je mee spelen om de gevonden resultaten te beïnvloeden maar met Similar zou je de meeste dubbele titels moeten kunnen vinden als je ook de twee velden ingevuld hebt in je bibliotheken. Klik vervolgens op OK om de twee bibliotheken te doorzoeken.

calibre ontdubbelen

En als er dubbele titels zijn dan ga je daar een melding van krijgen. In mijn geval is het slechts 1 boek (en dat klopt want de testbibliotheek had maar 5 boeken met 1 overlappende titel) en kun je zien om welke boeken het gaat door op Toon details te klikken.

Klik je daarna op OK, dan kom je terug in het hoofdscherm van Calibre waar vervolgens alle gevonden dubbele boeken gemarkeerd en gefilterd zijn in de geopende bibliotheek. Je kunt ze dan eenvoudig allemaal selecteren en verwijderen zodat de boeken nog maar in één bibliotheek staan.

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (3) Write a comment

  1. Ik heb drie bibliotheken in gebruik:
    – Literatuur
    – Studieboeken
    – Artikelen (van tijdschriften)

    Met deze indeling krijg je niet snel een overlap.

    Reply

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top