Over discovery tools en het gebruik van Google Scholar in bibliotheken

Web scale discovery services, of discovery tools zoals ze in goed Nederlands meestal genoemd worden, bestaan al een aantal jaren. Ze zijn ontstaan vanuit het idee dat – vooral in academische (onderwijs)instellingen – gebruikers moeite hebben om alle content terug te vinden waar de bibliotheken een licentie op genomen heeft. In plaats van tientallen databanken en bijbehorende zoekinterfaces aan te bieden, inclusief het uitleggen van de subtiele verschillen qua inhoud en de grote verschillen qua interface en mogelijkheden, beloofden discovery tools een soort metazoekmachine te zijn voor al die bronnen. Inclusief de eigen catalogus voor het (beter) vindbaar maken van de fysieke collectie. 

Dat doen discovery tools niet door als een schil bovenop al die databanken te fungeren en de zoekactie in zoveel mogelijk bronnen tegelijk uit te laten voeren – want de eerdere federated searchtools bleken daar niet heel goed in te zijn – maar door zelf één index te maken van alles wat er *in* die databanken zit die je als bibliotheek hebt gelicenseerd.

“Web scale discovery” refers to a class of products that index a vast number of resources in a wide variety formats and allow users to search for content in the physical collection, print and electronic journal collections, and other resources from a single search box. Search results are displayed in a manner similar to Internet searches, in a relevance ranked list with links to online content. (bron)

Federated search vs. discovery

Met federated search tools moest je noodgedwongen genoegen nemen met de grootste gemene deler van alle databanken die je er mee wilde doorzoeken. Uiteindelijk deed het maar één ding en dat was de zoekactie in de overkoepelende zoekmachine vertalen naar zoekacties in de onderliggende databanken, deze uitvoeren en vervolgens alle zoekresultaten in één lijst verzamelen. Dat klinkt ideaal maar in de praktijk werkte het een stuk minder. Een titel en auteursveld hebben de meeste databanken wel maar hoe diverser de databanken waren die je wilde doorzoeken, hoe lastiger het was om die zoekactie correct te vertalen. Er waren connectoren nodig die de vertaalslag maakten tussen de zoekinterface van de federated zoekmachine en die van een databank en bij elke wijziging bij een leverancier moest dat weer aangepast worden.

Discovery tools hebben daar geen last van want ze indexeren de inhoud van alle databanken waardoor de zoekmachine eigenlijk een zelf samengestelde databank wordt. Dat heeft grote voordelen maar ook weer nadelen. Om de inhoud te kunnen indexeren moet de discovery tool toegang krijgen tot de inhoud in de databanken en daar kunnen & willen niet alle leveranciers van databanken aan meewerken. De uitdaging van het werkend krijgen van alle connectoren bij federated search tools is bij discovery tools vervangen door het beschikbaar proberen krijgen van de metadata bij de leveranciers van alle databanken.

Alle databanken?

Alle soorten databanken op één hoop gooien en tegelijkertijd willen doorzoeken bleek al lastig te zijn met federated search. Je zoekt nu eenmaal op hele andere velden als je naar jurisprudentie zoekt, bedrijfsgegevens, video’s, krantenartikelen, handboeken, ebooks of (wetenschappelijke) artikelen. Met discovery tools gaat dat wel een beetje beter maar behoud je het probleem dat 1 index en 1 zoekinterface maken toch echt een stuk beter werkt naar mate je niet al te veel verschillende soorten materiaalsoorten door elkaar mengt in die index. Op die manier zorg je er voor dat je beter en sneller vindt wat je zoekt (doordat er geen duizenden treffers op een zoekterm zijn) en kan de zoekmachine ook beter de zoekresultaten ontdubbelen.

Het is ongetwijfeld ook één van de redenen geweest dat de eerste universiteitsbibliotheek (van Utrecht), die in Nederland een discovery tool implementeerde, er voor koos om deze alleen te gebruiken voor het beter vindbaar maken van wetenschappelijke full-text artikelen. Niet alleen is het helder voor een gebruiker wat er wel en niet te vinden is maar het vermeed ook het probleem dat voor een groot deel van alle (andersoortige) databanken gold dat ze niet eens opgenomen konden worden.

In de hogeschoolbibliotheek

Ook hogeschoolbibliotheken zijn de laatste paar jaren druk bezig met het aanschaffen en implementeren van discovery tools. Dat komt vooral voort uit de wens om die ene zoekmachine te creëren voor studenten waarin met een eenvoudige zoekbalk – a la Google – in één keer de gehele digitale collectie doorzocht kan worden. Maar daar lopen de hogescholen wederom tegen het probleem aan van de diversiteit van alle databanken die gezamenlijk hun digitale collecties vormen. Want zelfs na bijna vier jaar discovery tools in Nederland zijn er nog bijna geen Nederlandse leveranciers die de metadata uit hun databanken kunnen/willen aanleveren aan de leveranciers van de discovery tools.

En daar waar universiteitsbibliotheken vooral wetenschappelijke bronnen met full-text artikelen hebben, hebben hogeschoolbibliotheken vooral vakinhoudelijke databanken met inhoud die varieert per leverancier en meestal ook uniek is voor die ene leverancier. De vraag die je als bibliotheek dan moet beantwoorden is welk probleem je nou precies aan het oplossen bent door een discovery tool in te richten.

In een discovery tool kun je niet meteen zien uit welke databank een gevonden item afkomstig is en de term ‘discovery’ slaat dan ook niet op het ontdekken van de individuele databanken maar op de inhoud ervan. Dat suggereert – bij mij tenminste – dat je diè (databanken met) inhoud moet opnemen in een discovery tool die je gebruikers anders moeilijk kunnen vinden. Niet om maar simpelweg alles in 1 zoekmachine te willen proppen omdat gebruikers liever niet willen weten in welke databank datgene zit dat ze zoeken. Ook als dat iedere keer eigenlijk maar één vakinhoudelijke databank is waar die inhoud als enige in zit.

“Onze studenten willen een Google zoekbalkje”

Dat zei iemand van een andere hogeschoolbibliotheek tegen mij. Ik vroeg hoe dat paste in hun informatievaardighedenbeleid om studenten te leren informatie te verwerven en te verwerken uit databanken en bronnen die ze ook in de beroepspraktijk tegen gaan komen. Maar ik kreeg daar geen antwoord op. Wel verzuchtte een andere collega bij weer een andere hogeschoolbibliotheek dat er toch echt wat meer druk gezet moest worden op die leveranciers om hun metadata aan te leveren voor de discovery tools van de hogescholen. Die gaf me wel een antwoord toen ik vroeg wat hun idee was over welke databanken dan in hun discovery tool moesten. Gewoon allemaal.

En waarom heb ik net het bovenstaande allemaal zitten tikken? Om mijn eigen mening te vormen over welk probleem discovery tools nou echt oplossen. Om te proberen te begrijpen waarom diverse hogeschoolbibliotheken er voor gekozen hebben er eentje aan te schaffen. Omdat ik niet snap waarom je een eigen versie van Google wilt maken terwijl het overduidelijk onwaarschijnlijk is dat je ooit alle databanken uit je collectie kunt toevoegen aan zo’n eigen zoekmachine. En ik denk dat het haaks staat op je eigen taak van informatievoorziening en informatievaardigheden in het hbo.

Google doet dat namelijk al beter dan je ooit zelf zou kunnen

Leuk zo’n Google zoekbalkje maar dat doet Google zelf met hun zoekmachine veel beter dan een discovery tool het gaat doen. Sterker nog, ze hebben al jaren lang hun eigen discovery tool met Google Scholar. Die wordt goed gebruikt door onderzoekers bij hogescholen en wordt in de academische wereld als een volwaardig alternatief gezien voor de door de bibliotheken aangeboden discovery tools. De Universiteit van Utrecht heeft inmiddels zelfs afscheid genomen van hun discovery tool en focust zich nu op Google Scholar.

En wij van Windesheim?

Toen Windesheim twee maanden geleden besloot meerdere wetenschappelijke databanken te licenseren ten behoeve van onderzoekers, medewerkers en studenten hoefden we niet lang na te denken. Het maakt gebruikers niet uit of een wetenschappelijk artikel in Science Direct staat of in Wiley of in Springerlink. Dus lag het voor de hand om ze op te nemen in een eigen discovery tool zodat je ook een zoekmachine hebt waarin je de artikelen vindt waar je ook echt toegang tot hebt. Natuurlijk wilden we ze eveneens doorlinken vanuit Google Scholar maar Scholar verwijst ook naar miljoenen artikelen die niet in één van onze databanken zit. Het één doen en het ander niet laten.

En dat is precies wat we gedaan hebben. Vanaf vandaag is WindeSearch (discovery tool Summon van leverancier Serials Solutions) beschikbaar als een zoekmachine voor alle (wetenschappelijke) full-text artikelen in onze digitale collectie. Uit de gelicenseerde databanken, aangevuld met Open Access tijdschriften. En natuurlijk kunnen onze gebruikers rechtstreeks naar die databanken toe om ze te doorzoeken maar ik weet eigenlijk wel zeker dat het zoeken (en vinden) via Google Scholar de meest populaire weg zal zijn naar die artikelen.

scholar windesheim discovery tools
WindeSearch bevat niet de inhoud van onze bibliotheekcatalogus want we hebben bijna geen wetenschappelijke boeken in onze fysieke collectie. Ook hebben we vooralsnog niet het voornemen om de vakinhoudelijke databanken op te nemen in de index. Waarom zouden we? Voor die vakinhoudelijke databanken maken we afspraken met de opleidingen over het gebruik ervan. Omdat ze nodig zijn in het onderwijs en omdat het databanken zijn die studenten later ook moeten kunnen gebruiken als ze afgestudeerd zijn. Dan heb je er weinig aan dat je hebt leren zoeken naar informatie in een bron die uniek voor Windesheim is en waar je niet eens in te zien kreeg uit welke databank die informatie oorspronkelijk kwam.

En dat die vakinhoudelijke databanken niet eens allemaal opgenomen *kunnen* worden is daarmee een probleem geworden waar wij in elk geval geen oplossing voor hoeven zoeken.

Verder lezen: Testing web-scale discovery services: how well do they work? (Usable Libraries blog) / Articles on discoveryHeads they win, tails we lose: Discovery tools will never deliver on their promiseWeb scale discovery & search (Flipboard magazine)

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (19) Write a comment

  1. Pingback: Ebooks in de hogeschoolbibliotheek: impressie van een SHB themamiddag - Vakblog

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top