[gastpost] Op weg naar de Amazoogle bibliotheek?

In een interessant artikel onder de titel “Discovery versus Disintermediation” schetst Jane Burke, vice-president van Pro Quest de ontwikkeling van nieuwe zoektechnologieën in de digitale bibliotheek. ProQuest is een toonaangevende Amerikaanse leverancier van informatieproducten, zowel content (o.a. dissertaties) als software. Collega Jo Han Khouw schreef een al net zo interessante vrije bewerking van dit artikel op het Windesheim intranet, 12 oktober jl. Hoewel hij het inmiddels ook op zijn eigen weblog heeft gezet neem ik met permissie de gehele post over minus de afbeeldingen, zodat ik er later in mijn eigen blogposts eenvoudiger aan kan refereren. Het volledig zonder toestemming mutileren van de logo’s van Amazon en Google hierboven komt echter volledig op mijn eigen conto.

Disintermediatie doelt op het verschijnsel dat in veel bedrijfstakken er steeds minder plaats is voor tussenpersonen (bijvoorbeeld in de reisbranche, boek- en muziekhandel). Ook bibliotheken krijgen hiermee te maken. Veel bibliotheken zien hun rol in onderzoeksprocessen verwateren. Ze worden mikpunt voor bezuinigingen en raken bij de eindgebruiker buiten beeld.

Bedreigingen
Bibliotheken bieden een geweldige rijkdom aan kwalitatief hoogstaande informatiebronnen, maar ze slagen er niet in om die veelheid van bronnen zo te organiseren dat eindgebruikers daarmee goed uit de voeten kunnen. Onderzoek (2009) bij wetenschappelijke bibliotheken geeft aan dat meer dan 80% van de studenten en medewerkers het scala van de aanwezige bronnen niet overziet, laat staan optimaal gebruikt. Drie oorzaken:

  • De startpagina van de bibliotheek biedt geen helder en aantrekkelijk startpunt voor onderzoek
  • Gangbare namen en beschrijvingen van databanken maken het moeilijk om geschikte bronnen te identificeren
  • Gebruikers hebben onvoldoende inzicht in het totale aanbod van informatiebronnen

Aan de kant van de eindgebruiker speelt een ander probleem: tijdgebrek. Studenten maar ook docenten zoeken informatie op basis van het “just in time” criterium. Snelle resultaten zijn cruciaal. Vandaar de populariteit van Google en internet. De bibliotheek wil studenten en medewerkers graag ondersteunen bij hun onderzoek, met betrouwbare bronnen. Maar de organisatie van die bronnen is vaak nogal ingewikkeld. Gebruikers moeten veel geduld en navigatievermogen opbrengen. Dikwijls ervaren zij onzekerheid en frustratie.

Het is een stevig dilemma. Investeren in de collectie, in nog meer digitale bronnen, verergert de complexiteit van het aanbod. Maar níet investeren is geen keuze, er komen altijd nieuwe bronnen bij. Wat bibliotheken niet inzien is dat eindgebruikers geen onderscheid maken tussen al die verschillende typen en formats van informatieobjecten.
De huidige organisatie van content in gescheiden silo’s of containers vormt een groot obstakel. Informatie moet beschikbaar komen via “single search” zoekacties. Eenvoudig, gemakkelijk en snel. Het Amazoogle model is het leidende principe.

Kansen
De strategie waar bibliotheken tegenwoordig op inzetten heet “discovery”. Dat kun je inderdaad vertalen als Ontdekking… Het gaat vooral over de optie van een geïntegreerd aanbod van content uit diverse bronnen. Daarnaast streeft men ernaar om de complexe kanten van informatiemanagement drastisch te vereenvoudigen.
Belangrijke elementen zijn:

  • Een aantrekkelijke zoekinterface
  • Gemakkelijk zoeken (single search) in allerlei typen metadata
  • Representatie van alle bibliotheekcollecties en soorten content.

De ontwikkelingen spitsen zich toe op drie categorieën van “discovery services” :

  • Vernieuwing van lokale bibliotheekcatalogi (Discovery Layers)
  • Instrumenten voor zgn. “federatief zoeken” (Federated Search)
  • Integratie van webcontent (Web-scale Discovery)

Catalogusvernieuwing
De traditionele bibliotheekcatalogus (web OPAC) wordt steeds meer verrijkt met Web 2.0 elementen (discovery layers): tags, coverafbeeldingen, commentaar, ratings, suggesties, facetgebaseerd zoeken, lokale taxonomieën, visualisatie van zoekresultaten en metadata, en niet in de laatste plaats de presentatie op mobiele platforms. De Aquabrowser, sinds kort een Proquest product, is een voorbeeld van een visuele zoekmachine die bij veel Nederlandse (openbare) bibliotheken bekend is. Naast de bibliotheekcollectie kunnen ook andere lokale bestanden worden ontsloten, bijv. een repository van medewerkerspublicaties. Een op die manier gepimpte publiekscatalogus zal veel aantrekkelijker zijn voor eindgebruikers. Maar ook zo’n Next-Gen catalogus is slechts een gedeeltelijke oplossing. De ontsluiting van fulltext content uit externe, commerciële databanken komt daarmee niet dichterbij.

Federatief zoeken
De wens om vanuit één interface en vanuit één enkele zoekvraag gelijktijdig en realtime meerdere contentverzamelingen (databanken) te doorzoeken is een lang bestaand ideaal. Bibliotheken in de jaren ’80 kenden al het z39.50 protocol om zoekvragen te vertalen naar verschillende databanken. In 1998 presenteerde Webfeat (ook Proquest) zich als de eerste echte federated search engine. Tegenwoordig bestaan er ontelbare vergelijkbare softwaretoepassingen, onder uiteenlopende noemers: metasearch, cross-databse search, broadcast search, distributed search, deep web search. Die laatste term geeft precies aan waar het om draait: het zoeken en vinden van content in niet publieke, commerciële databanken (ook wel aangeduid als het diepe web).

De kern van de federatieve zoekmachine bestaat uit connectoren, stukjes software die de zoekvraag vertalen en overdragen naar de aangesloten databanken. De resultaten van zoekacties moeten vervolgens worden terugvertaald, geordend, bijgeschaafd en ontdubbeld. Daar zitten dan meteen ook de zwakke plekken in het systeem. Connectoren zijn kwetsbaar, kunnen ontregeld raken of het zoekproces vertragen. Een andere zorg is of de opgeleverde en bewerkte zoekresultaten nog wel voldoende relevantie hebben.

Integratie van webcontent
Om aan de problemen van federatieve zoekmachines tegemoet te komen worden nu systemen ontwikkeld die niet werken met connectoren, maar met een vooraf aangelegde index (unified search index, pre-aggregate index). Dit vereist wel dat met alle betrokken contentleveranciers overeenkomsten worden gesloten over beschikbaarstelling van hun materiaal en metadata. Bestaande containers (databanken) moeten worden opengebroken om toegang tot de fulltext content mogelijk te maken, via die ene voorgecoördineerde index. Dat is een enorme opgave. Maar de eerste resultaten zijn er. In 2009 werd Summon (ook Proquest) gelanceerd als eerste “web-scale discovery service”. Het idee erachter is om de databankencollectie van de bibliotheek te ontsluiten volgens het Google-model. Om het beste van twee werelden te combineren: éénstaps zoeken naar hoogwaardige content in de bibliotheek. Gemakkelijk, eenvoudig en snel. Discovery is vandaag het toverwoord. Of dat het tij zal keren en de kloof tussen bibliotheek en eindgebruikers kan dichten? We lezen er de komende tijd ongetwijfeld meer over.

Naar de volledige tekst van het oorspronkelijke artikel

Meer:

Discovering discovery services

Discovery services don’t make federated search useless

Federated search: users might actually like it

Wil je een inhoudelijke reactie geven op het bovenstaande? Doe dat dan natuurlijk op het blog van Jo Han.

NVB-HB themadag Federated Search in hogeschoolbibliotheken

Breda is vanuit Deventer nog een aardig eindje maar inmiddels ben ik (net) weer thuis. Ik had me voorgenomen een verslag te maken maar ik zat grotendeels naast Ronald van Dieen (Ingressus) en die was tijdens het programma druk aan het meeschrijven op zijn blog. Met dank aan hem dus een verslag van vandaag op zijn blog, Bibaholic.

En ondanks openbaar vervoer problemen een hele prima opkomst van ca. 60 mensen, wat me aangenaam verrastte. Die kwamen natuurlijk allemaal op Gerard’s verhaal af :)

Puntjes op de (webf)ea(t)

Na gisteren de overeenkomst nog in een prettig gesprek met de afdeling Inkoop doorgenomen te hebben, zijn vandaag de laatste puntjes op de i gezet, en is het nu nog even wachten op de definitieve versie van de overeenkomst. Daarna kan het feest dan echt van start en kan ik ook eindelijk serieus aan de slag met mijn projectgroep om zowel A-to-Z, de linkresolver LinkSource en natuurlijk WebFeat te gaan implementeren.

Ik heb er, na het doorwerken van een aantal artikelen en boeken, al een redelijk beeld bij voor mezelf wat we precies aan eindresultaat willen hebben en dat komt goed uit, want morgen is de NVB-HB themadag Federated Search in hogeschoolbibliotheken en dat is natuurlijk een mooie gelegenheid om zowel met leveranciers als gebruikers en geinteresseerden eens van gedachten te wisselen.

Ondanks het feit dat de NVB-OB geduchte concurrentie levert door morgen met een Lezen 2.0 themadag te komen in de Bibliotheek Rotterdam (en ze Moqub als topattractie hebben), hebben zich toch een heel aardig aantal mensen aangemeld dus dat moet goed komen. Jammer van die stakingen in het streekvervoer overigens maar ja. Morgenavond volgt nog een verslagje hoop ik.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top