Doorzoeken van afbeeldingen met een zoekmachine

Met zoekmachines kun je tegenwoordig belachelijk ontzettend veel vinden op internet maar de beperkingen van zoekmachines worden er ook steeds duidelijker door. Een zoekmachine indexeert (content op) websites en doet allerlei slimme dingetjes om o.a. uit de context van een website en hoe mensen die sites zoeken af te leiden welke metadata automatisch toegekend kan worden. Dat werkt heel erg goed voor teksten maar aanzienlijk minder voor content die niet te indexeren valt zoals foto’s en video’s. Het blijft wachten op slimme technieken waarmee zoekmachines zelf beeld- en videomateriaal kunnen herkennen op een manier dat je dat materiaal goed doorzoekbaar kunt maken.

Tot het zo ver is zal die metadata handmatig -door mensen dus- meegegeven moeten worden  aan afbeeldingen en foto’s wil je met enige mate van betrouwbaarheid dat materiaal ook goed kunnen terugvinden. Dat is de reden waarom je bij uploadsites als YouTube en Flickr gevraagd wordt om omschrijvingen en steekwoorden te geven bij het materiaal dat je uploadt. Die worden rechtstreeks gebruikt voor de zoekfuncties van de sites.

Calvin and Hobbes
Een heel mooi voorbeeld van hoe goed je afbeeldingen kunt terugvinden als je maar investeert in goede metadata is de Calvin and Hobbes zoekmachine. Calvin and Hobbes (of in het Nederlands Casper en Hobbes) is een krantenstrip die tussen 1985 en 1995 dagelijks verscheen. Het zijn dus vele honderden korte strips die uit enkele panelen bestaan en later ook gebundeld in albums zijn uitgegeven. Het is met afstand ook mijn favoriete strip aller tijden door de vele lagen die schrijver en tekenaar Bill Watterson aanbracht maar dat terzijde.

Ondanks, of waarschijnlijk juist dankzij, het feit dat er maar heel weinig fansites bestaan over Calvin & Hobbes -Bill Watterson heeft een afkeer van commercie waardoor zijn strips niet op fansites mogen verschijnen- hebben mensen veel tijd gestoken in het uitschrijven van alle (!) Calvin & Hobbes strips. Alle scripts maar ook beschrijvingen van de individuele strips die de achtergronden weergeven. Met deze teksten is het dan ook kinderspel om een zoekmachine te maken waarmee je de individuele strips kunt terugvinden op elke uitspraak of omschrijving van wat er in die strip gebeurt.

Voorbeeldje
Als je zoekt op ‘library‘ dan vind je de 19 strips waarin dat woord voorkomt. Dat zijn dan bijvoorbeeld de strips waarin het woord zelf voorkomt in een tekstbox of dialoog:

Het woord library komt zowel voor in het script als ook in de beschrijving. Dat hoeft dus niet het geval te zijn want je vindt ook strips waar het woord niet voorkomt in het script maar waar het in de beschrijving staat omdat het zich bijvoorbeeld afspeelt in een bibliotheek.

Nou zou het te ver gaan om alle afbeeldingen, foto’s en strips die op het internet te vinden zijn handmatig te gaan uitwerken op deze manier maar de voordelen van goede beschrijvingen meegeven aan je foto’s en video’s worden wel goed zichtbaar met dit soort voorbeelden. Ook al worden die uploaddiensten steeds vernuftiger met automatisch scripts en beschrijvingen maken (zoals YouTube met automatisch ondertitelen), er is geen vervanging voor het perspectief en expertise van de persoon die het materiaal uploadt en dus blijf je afhankelijk van de inspanning die de uploader er voor wil doen.

Nou zou ook Calvin maar weinig moeite hiervoor gedaan hebben maar hij zou het wel handig gevonden hebben als er in zijn tijd betere zoekmachines waren geweest ;-)

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (3) Write a comment

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top