[gastpost] Op weg naar de Amazoogle bibliotheek?

In een interessant artikel onder de titel “Discovery versus Disintermediation” schetst Jane Burke, vice-president van Pro Quest de ontwikkeling van nieuwe zoektechnologieën in de digitale bibliotheek. ProQuest is een toonaangevende Amerikaanse leverancier van informatieproducten, zowel content (o.a. dissertaties) als software. Collega Jo Han Khouw schreef een al net zo interessante vrije bewerking van dit artikel op het Windesheim intranet, 12 oktober jl. Hoewel hij het inmiddels ook op zijn eigen weblog heeft gezet neem ik met permissie de gehele post over minus de afbeeldingen, zodat ik er later in mijn eigen blogposts eenvoudiger aan kan refereren. Het volledig zonder toestemming mutileren van de logo’s van Amazon en Google hierboven komt echter volledig op mijn eigen conto.

Disintermediatie doelt op het verschijnsel dat in veel bedrijfstakken er steeds minder plaats is voor tussenpersonen (bijvoorbeeld in de reisbranche, boek- en muziekhandel). Ook bibliotheken krijgen hiermee te maken. Veel bibliotheken zien hun rol in onderzoeksprocessen verwateren. Ze worden mikpunt voor bezuinigingen en raken bij de eindgebruiker buiten beeld.

Bedreigingen
Bibliotheken bieden een geweldige rijkdom aan kwalitatief hoogstaande informatiebronnen, maar ze slagen er niet in om die veelheid van bronnen zo te organiseren dat eindgebruikers daarmee goed uit de voeten kunnen. Onderzoek (2009) bij wetenschappelijke bibliotheken geeft aan dat meer dan 80% van de studenten en medewerkers het scala van de aanwezige bronnen niet overziet, laat staan optimaal gebruikt. Drie oorzaken:

 • De startpagina van de bibliotheek biedt geen helder en aantrekkelijk startpunt voor onderzoek
 • Gangbare namen en beschrijvingen van databanken maken het moeilijk om geschikte bronnen te identificeren
 • Gebruikers hebben onvoldoende inzicht in het totale aanbod van informatiebronnen

Aan de kant van de eindgebruiker speelt een ander probleem: tijdgebrek. Studenten maar ook docenten zoeken informatie op basis van het “just in time” criterium. Snelle resultaten zijn cruciaal. Vandaar de populariteit van Google en internet. De bibliotheek wil studenten en medewerkers graag ondersteunen bij hun onderzoek, met betrouwbare bronnen. Maar de organisatie van die bronnen is vaak nogal ingewikkeld. Gebruikers moeten veel geduld en navigatievermogen opbrengen. Dikwijls ervaren zij onzekerheid en frustratie.

Het is een stevig dilemma. Investeren in de collectie, in nog meer digitale bronnen, verergert de complexiteit van het aanbod. Maar níet investeren is geen keuze, er komen altijd nieuwe bronnen bij. Wat bibliotheken niet inzien is dat eindgebruikers geen onderscheid maken tussen al die verschillende typen en formats van informatieobjecten.
De huidige organisatie van content in gescheiden silo’s of containers vormt een groot obstakel. Informatie moet beschikbaar komen via “single search” zoekacties. Eenvoudig, gemakkelijk en snel. Het Amazoogle model is het leidende principe.

Kansen
De strategie waar bibliotheken tegenwoordig op inzetten heet “discovery”. Dat kun je inderdaad vertalen als Ontdekking… Het gaat vooral over de optie van een geïntegreerd aanbod van content uit diverse bronnen. Daarnaast streeft men ernaar om de complexe kanten van informatiemanagement drastisch te vereenvoudigen.
Belangrijke elementen zijn:

 • Een aantrekkelijke zoekinterface
 • Gemakkelijk zoeken (single search) in allerlei typen metadata
 • Representatie van alle bibliotheekcollecties en soorten content.

De ontwikkelingen spitsen zich toe op drie categorieën van “discovery services” :

 • Vernieuwing van lokale bibliotheekcatalogi (Discovery Layers)
 • Instrumenten voor zgn. “federatief zoeken” (Federated Search)
 • Integratie van webcontent (Web-scale Discovery)

Catalogusvernieuwing
De traditionele bibliotheekcatalogus (web OPAC) wordt steeds meer verrijkt met Web 2.0 elementen (discovery layers): tags, coverafbeeldingen, commentaar, ratings, suggesties, facetgebaseerd zoeken, lokale taxonomieën, visualisatie van zoekresultaten en metadata, en niet in de laatste plaats de presentatie op mobiele platforms. De Aquabrowser, sinds kort een Proquest product, is een voorbeeld van een visuele zoekmachine die bij veel Nederlandse (openbare) bibliotheken bekend is. Naast de bibliotheekcollectie kunnen ook andere lokale bestanden worden ontsloten, bijv. een repository van medewerkerspublicaties. Een op die manier gepimpte publiekscatalogus zal veel aantrekkelijker zijn voor eindgebruikers. Maar ook zo’n Next-Gen catalogus is slechts een gedeeltelijke oplossing. De ontsluiting van fulltext content uit externe, commerciële databanken komt daarmee niet dichterbij.

Federatief zoeken
De wens om vanuit één interface en vanuit één enkele zoekvraag gelijktijdig en realtime meerdere contentverzamelingen (databanken) te doorzoeken is een lang bestaand ideaal. Bibliotheken in de jaren ’80 kenden al het z39.50 protocol om zoekvragen te vertalen naar verschillende databanken. In 1998 presenteerde Webfeat (ook Proquest) zich als de eerste echte federated search engine. Tegenwoordig bestaan er ontelbare vergelijkbare softwaretoepassingen, onder uiteenlopende noemers: metasearch, cross-databse search, broadcast search, distributed search, deep web search. Die laatste term geeft precies aan waar het om draait: het zoeken en vinden van content in niet publieke, commerciële databanken (ook wel aangeduid als het diepe web).

De kern van de federatieve zoekmachine bestaat uit connectoren, stukjes software die de zoekvraag vertalen en overdragen naar de aangesloten databanken. De resultaten van zoekacties moeten vervolgens worden terugvertaald, geordend, bijgeschaafd en ontdubbeld. Daar zitten dan meteen ook de zwakke plekken in het systeem. Connectoren zijn kwetsbaar, kunnen ontregeld raken of het zoekproces vertragen. Een andere zorg is of de opgeleverde en bewerkte zoekresultaten nog wel voldoende relevantie hebben.

Integratie van webcontent
Om aan de problemen van federatieve zoekmachines tegemoet te komen worden nu systemen ontwikkeld die niet werken met connectoren, maar met een vooraf aangelegde index (unified search index, pre-aggregate index). Dit vereist wel dat met alle betrokken contentleveranciers overeenkomsten worden gesloten over beschikbaarstelling van hun materiaal en metadata. Bestaande containers (databanken) moeten worden opengebroken om toegang tot de fulltext content mogelijk te maken, via die ene voorgecoördineerde index. Dat is een enorme opgave. Maar de eerste resultaten zijn er. In 2009 werd Summon (ook Proquest) gelanceerd als eerste “web-scale discovery service”. Het idee erachter is om de databankencollectie van de bibliotheek te ontsluiten volgens het Google-model. Om het beste van twee werelden te combineren: éénstaps zoeken naar hoogwaardige content in de bibliotheek. Gemakkelijk, eenvoudig en snel. Discovery is vandaag het toverwoord. Of dat het tij zal keren en de kloof tussen bibliotheek en eindgebruikers kan dichten? We lezen er de komende tijd ongetwijfeld meer over.

Naar de volledige tekst van het oorspronkelijke artikel

Meer:

Discovering discovery services

Discovery services don’t make federated search useless

Federated search: users might actually like it

Wil je een inhoudelijke reactie geven op het bovenstaande? Doe dat dan natuurlijk op het blog van Jo Han.

WebFeat en SURFfederatie nu ook samen een blijvertje

Het is na 4 weken blogstilte even wat nieuwtjes inhalen en daar begin ik vandaag dan mee. Ik heb de paar duizend ongelezen feedberichten maar allemaal gemarkeerd als gelezen want daar kom ik echt niet meer doorheen. Enkele nieuwtjes vielen wel op en 1 ervan kwam zowel via de Ebsco nieuwsbrief als van de site van de SURFfederatie.

Sinds 13 januari is WebFeat technisch aangesloten op de SURFfederatie. Het is nu voor leden van de SURFfederatie mogelijk om toegang te krijgen tot de handige zoekmachine van WebFeat. WebFeat is de eerste federatieve zoekmachine die op de markt werd gebracht. Met WebFeat doorzoeken gebruikers een onbeperkt aantal databanken tegelijkertijd. Met één zoekactie worden alle elektronische bronnen in de bibliotheek geraadpleegd en wordt de gewenste informatie snel en eenvoudig gevonden.

Dat is vooral fijn voor ons op Windesheim aangezien wij de SURFfederatie gebruiken voor de (thuis)toegang tot onze federatieve zoekmachine en het nu in elk geval niet zo zal zijn dat de stekker uit die combinatie gaat. Hoop ik ;)

Federatieve toegang tot SeekQ!

Nou, het heeft allemaal flink langer geduurd dan ik had gehoopt en gepland maar een belangrijke horde lijkt nu eindelijk genomen te zijn. Na aanschaf van de federatieve zoekmachine WebFeat eerder dit jaar was het de bedoeling om live te gaan per september maar zowel ontwikkelingen met onze website als de hele thuistoegang tot SeekQ (zoals we de zoekmachine gedoopt hebben) gooiden roet in het eten.

Connectoren die maar niet gemaakt werden (zoals die voor onze catalogus) zijn ‘ineens’ nu wel beschikbaar en sinds deze week is de toegang tot onze WebFeat ook gerealiseerd buiten Windesheim via de SURFfederatie en ik was dan ook aangenaam verrast het inlogscherm van onze aselect server aan te treffen.

Het is nog steeds niet wat we echt wilden, want dat was het incorporeren van de Hidden Automatic Navigator urls in de ca 25 connectoren voor de databanken maar goed, het bewijst maar weer dat het implementeren van een federatieve zoekoplossing nog steeds niet zo eenvoudig is als je wel zo verwachten/hopen.

Nu nog het testen van de toegankelijkheid van de opgevraagde informatie nadat je een zoekactie hebt uitgevoerd en dan zouden ook wij na Fontys en Hogeschool Utrecht dan ook eens eindelijk live kunnen gaan!

 • © 2006- 2021 Vakblog – werken met informatie
  Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top