calibre header

Tonen van het aantal pagina’s van ebooks in een eigen kolom in Calibre

Je kunt bij ebooks niet echt spreken van het aantal pagina’s natuurlijk. Dit is afhankelijk van de grootte van het scherm, lettergrootte en diverse andere instellingen op je ereader waar je het ebook op leest. Toch is het fijn om een (goede) indicatie te hebben van hoe ‘dik’ een boek is voordat je het op je ereader zet. Met behulp van de ‘Count Pages’ plugin kun je in Calibre je ebooks laten analyseren en een inschatting maken van het aantal pagina’s. Dit kan vervolgens getoond worden in de bibliotheek in een aparte kolom.

Pagina’s of woorden?

Eigenlijk is het heel vreemd om van een aantal pagina’s uit te gaan als je er over nadenkt. Bij papieren boeken zijn de verschillen ook heel groot onderling want als een uitgever een boek opmaakt met wat grotere letters, grotere marges en grotere regelafstand dan krijg je ook fors meer pagina’s dan een boek waar alles met piepkleine letters op een pagina gepropt wordt.

Het is de reden dat de schrijvers van de boeken het ook meestal over het aantal woorden hebben. Een verhaal van 50.000 woorden is een niet al te dik boek (of stevige novelle) terwijl je met 200.000 woorden al een dikke pil a la Stephen King te pakken hebt. Al heeft hij met The Stand ook een boek geschreven dat slechts een paar duizend woorden onder de half miljoen woorden blijft.

Als lezer is het aantal woorden echter niet zo veelzeggend en ben je toch eerder genegen om de lengte van boeken te vergelijken met behulp van het aantal pagina’s. Al was het maar omdat die duidelijk aangegeven staan in papieren boeken.

Bij ebooks heb je geen paginanummering omdat een pagina geen vaste opmaak kent. Afhankelijk van de grootte van het scherm van je ereader en de leesinstellingen die je prettig vindt, kan een ebook meer of minder ‘schermen’ hebben die je door moet bladeren.

Desondanks blijft het prettig om een beeld te hebben van hoe lang/groot een verhaal is en merk ik dat ik nog steeds regelmatig een ebook open in Digital Editions om een indicatie van het aantal pagina’s te krijgen. Dat is een hoop werk om voor elk boek te doen en daarom zocht ik naar een manier om dat geautomatiseerd te doen en het aantal pagina’s ergens in Calibre te kunnen opslaan. Met de Calibre plugin ‘Count Pages’ bleek dat heel eenvoudig te zijn!

Pagina’s tonen per titel in Calibre

Count Pages is een plugin die in staat is om zowel het aantal woorden als pagina’s te tellen van een ebook. Hiervoor wordt het ebookformaat gebruikt dat als standaard staat ingesteld bij Voorkeuren->Gedrag en dat zal voor de meeste mensen (in Nederland) EPUB zijn. Als een titel meerdere ebookformaten heeft dan wordt dus EPUB gebruikt om het aantal woorden/pagina’s in te tellen.

De plugin telt woorden op een hele eenvoudige wijze (tekst die links en rechts gescheiden zijn door spaties worden als woorden gezien) maar gebruikt een algoritme om hieruit het aantal pagina’s af te leiden. De getallen die hier uit komen – het aantal woorden en het aantal pagina’s – kunnen vervolgens getoond worden in een eigen kolom in Calibre. Behalve dat je de plugin moet installeren en configureren dien je dus ook een eigen aangepaste kolom aan te maken. Voor deze handleiding maak ik er slechts eentje aan voor de hoeveelheid pagina’s maar je kunt er dus ook een tweede aanmaken die specifiek voor het woordenaantal is.

Stap 1. Installeren van de Count Pages plugin

Ga naar Voorkeuren->Plug-ins en kies daar helemaal onderaan voor Nieuwe plug-ins verkrijgen. Count Pages is beschikbaar in de ingebouwde lijst met Niet geïnstalleerde plugins en je kunt makkelijk de lijst filteren om de goede plugin te vinden.

calibre pagina's

Klik daarna op Installeren om Count Pages te installeren.

Stap 2. Voeg de knop toe aan de menu’s in Calibre

Calibre vraagt je tijdens de installatie van Count Pages aan welke werkbalken/menu’s je de knop wilt toevoegen. Standaard staan de eerste twee geselecteerd en dat is prima. De knop is dan in de hoofdwerkbalk te zien.

calibre pagina's

Stap 3. Toevoegen van een eigen kolom

De output van Count Pages kan alleen worden weergegeven in een eigen kolom en daarom maken we eerst een nieuwe kolom aan voordat we de plugin gaan configureren.

calibre pagina's

Ga weer naar Voorkeuren en klik daar op Voeg eigen kolommen toe.

Stap 4. Maak de nieuwe kolom aan

Klik op het icoontje met het groene plus-teken om een nieuwe aangepaste kolom te maken.

calibre pagina's

Stap 5. Vul de correcte waarden in

Je kunt bij Opzoeknaam zelf bepalen wat je invult hoewel deze geen spaties of leestekens mag bevatten. Ik wissel zelf veel tussen Nederlands en Engels en gebruik daarom ‘pages’ als opzoeknaam. Deze wordt als interne verwijzing gebruikt maar bij Koptekst kun je het label invullen wat je in de bibliotheek te zien krijgt. Hier kun je ook zelf bepalen wat je invult hoewel ik het zo kort mogelijk zou houden.

calibre pagina's

Bij Kolomtype moet je kiezen voor Gehele getallen en bij de Beschrijving kun je wederom alles invullen wat je wil. Bij Weergave van nummers moet je {0:,d} invullen. Of je kunt de Python documentatie doorlezen voor andere weergave van de getallen ;-)

Stap 6. Even opnieuw opstarten

ebookformaten calibre

Er valt nog wel iets te verbeteren aan de Nederlandse tekst in Calibre.

Stap 7. Configureren van Count Pages

Nu de nieuwe kolom is aangemaakt voor het aantal pagina’s wordt het tijd om Count Pages in te stellen en te vertellen dat deze kolom gebruikt kan/moet worden.

Wil je ook een aparte kolom voor het aantal woorden in een ebook? Herhaal dan stappen 3 t/m 5 om een nieuwe kolom aan te maken met Opzoeknaam ‘woorden’, Koptekst: ”Woordenaantal’, Kolomtype: ‘Gehele getallen’ en Weergave van nummers: {0:,d}.

Klik op de Count Pages knop in het beginscherm.

calibre pagina's

De allereerste keer dat je dit doet zal gevraagd worden om de plugin te configureren.

calibre pagina's

Klik op Ja en vul de vereiste velden in.

calibre pagina's

Op het eerste tabblad kun je bij Page count options de aangepaste kolom selecteren die je zojuist gemaakt hebt. Bij Word count options kun je je eventueel tweede kolom selecteren mocht je deze aangemaakt hebben.

Bij de Page count options heb je nog de keuze welk algoritme de plugin moet gebruiken om het aantal pagina’s te berekenen. Je kunt dit gewoon op Paragraphs laten staan want het is het default algoritme en ik neem aan dat dit om een reden is, maar je hebt ook nog de keuze om het algoritme te gebruiken dat door Adobe Digital Editions of de Calibre ebookviewer gebruikt wordt. De overige velden bij Readability options hebben te maken met leesbaarheidsscores maar die laat ik buiten beschouwing nu.

calibre pagina's

Op het tweede tabblad (Overige) zijn er nog wat andere instellingen aan te passen die te maken hebben met het downloaden van het aantal pagina’s als metadata van Goodreads of een Poolse website. De Goodreads metadata kan alleen maar uitgelezen worden als je ook de Goodreads metadata plugin geïnstalleerd hebt en hoewel dat absoluut een aanrader is als je veel Engelstalige boeken leest, valt dit buiten deze handleiding.

Vink de beide opties af die in het rode vak aangegeven zijn zodat je ook niet de downloadoptie van de Poolse website te zien krijgt.

Stap 8. Berekenen van het aantal pagina’s

Goed, we hebben een lege kolom achter elke titel in de bibliotheek staan en de plugin is nu geconfigureerd. De Count Pages knop voert vanaf nu een actie uit als je 1 of meerdere titels geselecteerd hebt in de bibliotheek. De standaardactie is het berekenen van het aantal pagina’s maar je kunt in het pulldown menu (pijltje naast de knop) ook kiezen voor het downloaden van de gegevens van Goodreads als je de Goodreads metadata plugin ook geïnstalleerd hebt. En terug naar het configuratiescherm als je toch nog een paar instellingen wilt wijzigen.

calibre pagina's

Selecteer eerst 1 titel in je bibliotheek en klik dan op de Count Pages knop. Er wordt een taak gestart in Calibre, het EPUB bestand wordt gescand en het eindresultaat wordt in de kolom getoond.

Is dit goed gegaan? Dan kun je meerdere (of alle) titels selecteren en met Count Pages alle pagina-aantallen laten berekenen.

Hou er rekening mee dat Calibre hier wel even mee bezig kan zijn. Mijn bibliotheek bestaat uit iets meer dan 300 titels en het duurde 8 minuten voordat Calibre klaar was met scannen en de getallen toonde in de kolom. Ga dus niet je bibliotheek met 10.000 titels in 1 keer scannen voor de pagina-aantallen want dan ben je dus waarschijnlijk 4 uur verder.

Het eindresultaat ziet er dan ongeveer zo uit:

calibre pagina's

#

ebooks naar eigen smaak

Ebooks bewerken (en corrigeren) met behulp van Calibre en Sigil

Als je een papieren boek zonder omslag (of met een hele lelijke omslag) in de winkel zou zien staan, dan zou je die zeker niet kopen. Maar wat doe je als je, na aankoop, ontdekt dat de ebookversie een verkeerde omslag heeft? Of als een ingesloten lettertype er voor zorgt dat je niet je eigen lettertype kunt selecteren op je ereader? En wat als er OCR- of tikfouten in de tekst zijn geslopen? Laat vooral de uitgever weten dat die fouten gemaakt heeft maar je kunt ze vervolgens ook zelf aanpassen. Met Calibre en/of Sigil kun je ebooks bewerken en naar je eigen smaak aanpassen.

Omslagen toevoegen aan (of wijzigen in) ebooks

Ik weet niet wat het is maar er zijn veel uitgevers die nauwelijks aandacht besteden aan de omslagen voor ebooks. OK, ebooks liggen niet op een schap in een boekwinkel en hoeven dus met hun omslagen dus niet de aandacht te trekken maar ook op ereaders en in ereading apps is een omslag belangrijk.

Bij titels van de afgelopen jaren is dat overigens zelden een probleem maar kom je bij ebooks die van oudere titels van uitgevers gemaakt worden, dan kom je de meest rare dingen tegen. Generieke omslagen in één kleur waar alleen de titel en auteur op vermeld wordt bijvoorbeeld. Of afbeeldingen die (slecht) ingescand zijn van de voorkant van de papieren versie.

Maar hoe pas je nou de omslag aan? Of voeg je er eentje toe als er geen omslag is? Het gemakkelijkste is om een ebook te importeren in Calibre en daar vervolgens de omslag te wijzigen. De omslag is namelijk onderdeel van de metadata van een boek en net zoals je de titel, auteur, serie en beschrijving kunt aanpassen van een boek, kun je dit ook met de omslag doen. Een volledige handleiding vind je in een eerder artikel terug.

Gebruik je (liever) geen Calibre? Dan kun je ook omslagen toevoegen in de gratis ebookeditor Sigil.

ebooks bewerken omslag sigil

Als je een EPUB opent in Sigil dan krijg je in het linkerdeel alle bestanden te zien die in een ebook zitten. De xhtml bestanden in het mapje Text zijn de verschillende hoofdstukken, in Styles vind je de CSS bestanden waarmee de pagina’s opgemaakt worden en in Images vind je de in het ebook gebruikte afbeeldingen.

ebooks bewerken omslag sigil

In het menu kun je bij File -> Add -> Existing Files een nieuwe afbeelding selecteren en toevoegen aan je ebook. Deze komt dan automatisch in het mapje Images terecht en kan dan gemarkeerd worden als omslagafbeelding door er rechts op te klikken en voor Cover Image te kiezen. Er komt dan een vinkje te staan voor Cover Image zodat je weet welke afbeelding als omslag wordt gebruikt.

ebooks bewerken sigil

Dit zorgt er dus voor dat ereaders en ereading apps deze afbeelding tonen als omslag. Wil je de afbeelding ook in het ebook zelf zien? Dan zul je de xhtml pagina moeten bewerken waar de oude omslag in opgenomen is en dat is bijna altijd de eerste xhtml pagina in het lijstje.

Verwijderen van ingesloten lettertypes in ebooks

Uitgevers maken steeds vaker gebruik van ingesloten lettertypes om ebooks er zo fraai mogelijk er uit te laten zien als je ze leest. Het gebruik ervan is echter wel aan voorwaarden verbonden in de EPUB standaard die lang niet altijd netjes gevolgd worden. In de praktijk kom je dus heel vaak ebooks tegen die ingesloten lettertypes bevatten maar die niet aan de voorwaarden voldoen.

Afhankelijk van de ereader of ereading app waarin je het ebook wilt lezen kan het dan zijn dat je zelf niet meer een andere lettertype kunt selecteren. Dat is natuurlijk heel irritant aangezien het kunnen kiezen van je eigen favoriete lettertype nou net één van de grootste voordelen is van het digitaal lezen.

Er zijn gelukkig twee plugins voor het ebookbeheerprogramma Calibre waarmee je de lettertypes snel kunt verwijderen uit je ebooks.

Heb je een ereader van Kobo? Dan kun je gebruik maken van het feit dat het eigen EPUB formaat van Kobo  (KePub) altijd het veranderen van lettertypes mogelijk maakt. In dit artikel staat beschreven hoe je de KoboTouchExtended plugin installeert in Calibre. Deze plugin zorgt er voor dat alle ebooks vanuit Calibre automatisch in het KePub formaat op je ereader terecht komen. Je hoeft dus nooit zelf te controleren of een ebook wel of niet werkt, je kunt bij alle ebooks gegarandeerd het lettertype veranderen op je ereader.

Je hebt een ander merk ereader met een ebook waar je het lettertype niet van kunt veranderen? Of je wilt het in een ereading app zoals Marvin (iOS), Moon+Reader (Android) of iBooks lezen met een lettertype naar eigen keuze? Dan kun je de plugin Modify ePub installeren in Calibre waarmee je per ebook in je bibliotheek de embedded lettertypes kunt verwijderen.

  • Ga in Calibre naar Voorkeuren (Preferences) en klik links onderaan op Plug-ins (Plugins);
    veranderen van lettertypes
  • Klik in het scherm van Plugins wederom links onderaan op Nieuwe plug-ins verkrijgen (Get New Plugins);
    veranderen van lettertypes
  • Filter de goede plugin eruit door rechtsbovenaan ‘modify’ in te tikken. Je houdt dan alleen de Modify ePub plugin over die je kunt installeren;veranderen van lettertypes
  • Klik op OK om de Modify ePub knop in het hoofdmenu zichtbaar te krijgen en de installatie is klaar!
  • Heb je een ebook waar je de embedded lettertypes uit wilt halen, dan selecteer je dat boek in de Calibre bibliotheek en klik je op de Modify ePub knop;
  • Vink nu (alleen!) Remove embedded fonts aan en alle lettertypebestanden worden uit de ePub gehaald.
    veranderen van lettertypes
    De oorspronkelijke ePub wordt als backup bewaard maar je kunt de nieuwe versie naar je ereader sturen en nu wel het lettertype veranderen.

Ik stuur zelf ook vaak een mailtje naar de uitgever om aan te geven dat deze klant niet zit te wachten op ingesloten lettertypes maar daar reageren ze helaas niet (of nauwelijks) op.

Corrigeren van OCR- en tikfouten in ebooks met behulp van Sigil

Hoewel ik heel blij ben dat uitgevers ook hun oudere titels alsnog digitaliseren en als ebooks op de markt brengen, sluipen daar helaas vaak foutjes in. Vroeger kwam ik ze vooral tegen in (oude) Engelstalige titels die door kleinere uitgevers verkocht werden via Amazon – waar zelfs een procedure is om dit soort fouten te rapporteren – maar tot mijn spijt kom ik ze ook tegen bij ebookversies van o.a. klassieke kinderboeken.

Twee zomers geleden kocht ik 32 deeltjes van de Bob Evers serie die tjokvol foutjes zaten omdat de papieren boeken ingescand waren en de OCR software niet feilloos alle teksten correct herkende. Ik ben maanden bezig geweest om alles zelf te corrigeren en hoewel ik je dat niet zou aanraden – vraag je geld terug als je 160 euro uitgeeft aan slechte ebooks – kun je dat redelijk gemakkelijk doen met Sigil.

Ook de boeken van de Kameleon serie die sinds dit jaar als ebookversie te koop zijn (en in Kobo Plus zitten), zijn niet vrij van dergelijke OCR-fouten. En blijkt zelfs de oorspronkelijke tekst zoals die in de papieren boeken staat niet altijd foutvrij te zijn waardoor je bij de ebooks nu tenminste de kans hebt om deze te herstellen.

ebooks bewerken sigil

Aan de hand van deel 1 van de Kameleon reeks (die ik als enige heb gekocht tot de fouten uit de overige tientallen delen worden gehaald want ik ga niet weer maandenlang redigeren) kun je goed zien hoe je Sigil kunt gebruiken.

Allereerst is het altijd handig om bij de Images te controleren of de omslagafbeelding correct is ingesteld. Dit is in 99% van de gevallen geen enkel probleem maar toevallig vallen de Kameleon boeken onder de uitzonderingen. De omslagafbeelding is wel opgenomen in het ebook en staat ook op het voorblad maar is niet als zodanig gemarkeerd. Dit kun je dus fixen door op de cover afbeelding te rechtsklikken en dan voor Cover Image [1] te kiezen. Lees je het ebook dus op een andere ereader dan een Kobo, dan zie je pas na het instellen van de omslagafbeelding de omslag in de bibliotheek terug.

Sigil beschikt over een spellingscontrole (het ABC icoontje rechtsbovenaan) maar kent geen Nederlandse woordenlijst. En zelfs al zat die er wel in, dan nog is dat slechts een hulpmiddel omdat bij OCR fouten vaak wel een correct gespeld woord gekozen wordt maar dat simpelweg niet klopt in de zin.

‘... staken wel erg of bij ...‘ is daar een voorbeeld van. In veel gevallen zul je handmatig moeten corrigeren, ook al kan ik je de uitstekende zoek- en vervangfunctie [2] aanraden.

Houd er wel rekening mee dat de zoekfunctie alleen werkt in de HTML weergave van de hoofdstukken [4] en dat de zoekresultaten automatisch in die weergave getoond worden. Heb je één foutje gecorrigeerd (bijvoorbeeld warden naar worden), doorzoek dan meteen de rest van het ebook op diezelfde fout want de kans is groot dat de software meerdere keren die fout gemaakt heeft. Vergeet dan niet bij de zoekopties te kiezen om alle HTML bestanden te doorzoeken [3] zodat je ook het hele boek doorzoekt in plaats van dat ene hoofdstuk.

Heb je alles aangepast naar eigen smaak? Sla dan het EPUB bestand op en bewaar het op een veilige plek zodat je al je harde werk niet kwijt raakt.

@headerafbeelding bewerkt van een foto van Pixabay met een CC0-verklaring.

#

dode links header

Dode links in ebooks opsporen en repareren met behulp van Calibre

Dode links heb je niet alleen op websites maar kunnen ook in ebooks voorkomen. Met de Broken link checker van Calibre kun je deze dode links in ebooks opsporen en (handmatig) repareren met behulp van o.a. Google en The Wayback Machine.

Als je op een website met een linkje verwijst naar een andere website dan loop je het risico dat deze na verloop van tijd niet meer werkt. Webpagina’s worden verplaatst, verwijderd of komen achter een betaalmuur terecht waardoor de gevreesde 404 Not Found melding te voorschijn komt. Het is enorm veel werk om deze dode links op te sporen – ik spreek uit ervaring – en dat is de reden waarom ik linkrot tegenwoordig liever probeer te voorkomen op dit blog.

Maar dode links komen (helaas) niet alleen voor op websites. Ook in (non-fictie) ebooks wordt vaak gebruik gemaakt van links naar websites en online documenten als achtergrondinformatie bij de onderwerpen die besproken worden. Idealiter houdt een auteur of uitgever rekening met het feit dat deze links eigenlijk duurzaam moeten zijn – door ze te archiveren in The Wayback Machine of Perma.cc – maar in de praktijk zal dat maar zelden het geval zijn.

Ik liep er tegen aan in het exemplaar van ‘The End of Ownership‘ dat ik in november 2016 kocht. Een uitstekend boek maar toen ik het recentelijk opnieuw aan het doorspitten was viel me op dat meerdere links niet meer werkten. Ik ging op zoek naar een tooltje waarmee je dode links kunt opsporen, zoals die er ook voor websites zijn, en vond die – goed verstopt – in Calibre terug.

Dode links opsporen in Calibre

Sinds december 2013 beschikt Calibre over een eigen ebook-editor om ebooks te kunnen bewerken die in de bibliotheek staan. Het is een bijzonder handige tool om handmatig een ebook te repareren of aan te passen maar het kan ook een aantal dingen automatisch doen.

Zorg er dus eerst voor dat je het boek importeert in de Calibre bibliotheek en klik vervolgens op de menuknop Edit book om het in de editor te openen.

dode links ebooks calibre

De editor is een los programma en heeft zijn eigen menu. Onder Tools vind je daar een kopje External links en kun je vervolgens klikken op Check external links.

Calibre gaat vervolgens alle hyperlinks die naar webpagina’s of andere locaties buiten het ebook leiden controleren.

dode links ebooks calibre

Afhankelijk van hoeveel links er in het boek zitten duurt dat even maar na een tijdje krijg je een overzicht van links die niet rechtstreeks te openen zijn.

dode links ebooks calibre

In het geval van ‘The End of Ownership’ kreeg ik 26 links terug die een foutmelding opleverden. Je kunt klikken op het line number [1] om te zien waar in de tekst de link terug te vinden is – handig als je iets meer informatie nodig hebt om met behulp van Google een nieuwe link op te sporen – maar je kunt ook gelijk klikken op Fix this link [2] om de nieuwe URL op te geven. In het ebook wordt dan vervolgens de nieuwe link gebruikt.

Er is niet echt een stappenplan te maken van hoe je een (eventuele) gecorrigeerde link op het spoor komt maar je kunt het beste beginnen met de link zelf te kopiëren en te plakken in de browser (of Google) om te kijken of je een doorverwijzing vindt. Maar ook om vast te stellen of de link ook echt wel dood is want als er een cookie melding op een site staat dan zal de linkchecker het ook als een foutmelding terug krijgen.
Werkt de link wel gewoon? Vul dan de link gewoon opnieuw in bij Fix this link om het uit het lijstje met dode links te halen.

Link 1 bleek bijvoorbeeld nu een nieuwe URL-structuur te hebben omdat rechtspraak.nl vorig jaar de site vernieuwd heeft.

dode links ebooks calibre

Link 2 was echter van het internet verdwenen want de site shelffree.org.uk bestaat inmiddels niet meer. Een goede oplossing is dan om de link op te zoeken in The Wayback Machine die miljarden webpagina’s periodiek archiveert. En jawel, ook deze link bleek een maand nadat de blogpost gepubliceerd is gearchiveerd te zijn. Door op Fix this link te klikken kun je dan de (werkende) link ter vervanging van de bestaande opgeven.

dode links ebooks calibre

Documenten of webpagina’s die naar een (iets) andere URL zijn verplaatst komen ook veel voor en daar helpt het om de naam van het bestand – de pdf in dit geval – gewoon via Google op te zoeken. In dit geval bleek een sub(sub)domein geschrapt te zijn uit de URL.

En dit zul je uiteindelijk voor elke afzonderlijke link moeten gaan uitzoeken. Waarom werkt de link niet meer en is er een nieuwe link die nu gebruikt kan worden? Of dit al het werk waard is zul je voor jezelf moeten bepalen natuurlijk maar het is wel goed dat je tenminste de mogelijkheid hebt om de dode links in ebooks te repareren.

#

  • © 2006- 2021 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top