Wanneer kan ik eindelijk slimmer zoeken naar video of foto’s?

Jaren geleden keek ik vol nieuwsgierigheid uit naar een tijd waarbij computers eindelijk zo slim zouden zijn dat ze zelf konden herkennen wat er op foto’s en in video’s afgebeeld werd. Er bestonden al lang intelligente zoeksystemen die met teksten zo’n beetje alles konden doen wat je voor een goede zoekmachine nodig had. Natuurlijk heb je ook voor teksten ingewikkelde algoritmen, metadata modellen en slimme zoektechnologie nodig dus ondanks de voor de hand liggende uitdagingen bij foto’s, audiobestanden of video’s dacht ik dat het maximaal maar een paar jaar zou duren voordat we ook konden googelen op video- of fotomateriaal.

Maar dat kan toch met o.a. YouTube en Google Images?

Niet echt. Natuurlijk kun je op de vele video- en fotosites prima zoeken op beeldmateriaal maar je kunt alleen zoeken op termen die in teksten staan die anderen gekoppeld hebben aan dat beeldmateriaal. Een titel van een video bijvoorbeeld, of tags bij een foto of zelfs een beschrijving als je het geluk hebt dat de uploader die erbij heeft geschreven. Oftewel, nog steeds kun je beeldmateriaal alleen maar terugvinden aan de hand van de metadata, gegevens over dat materiaal, en niet aan de hand van wat er afgebeeld wordt.

En dat verbaast me wel.

De zoektechnologieën worden namelijk wel steeds beter. Specifieke foto’s en afbeeldingen terugvinden op internet door te zoeken met een foto, dat kan wel. Zowel Facebook en Picasa kunnen met redelijke accuraatheid zelf inschatten wie er op de foto’s staan afgebeeld en ik heb wel eens een technische demonstratie voorbij komen waarin de computer met grote accuraatheid weet wat er op een foto of video te zien is. Zolang jij de computer maar kunt voeren met miljoenen, miljarden of nog meer beelden en die kunt koppelen aan namen, locaties en zelfs onderwerpen, kan die computer beter dan jij of ik bepalen wat er in een specifiek beeld te zien is.

Het zal duur zijn om dat te doen, ongetwijfeld, maar technisch zou er geen belemmering moeten zijn om die context aan beeldmateriaal mee te laten geven in zoeksystemen. Om de audio in radio- en televisie uitzendingen automatisch te laten herkennen naar doorzoekbare teksten. Om net zo gemakkelijk beeldmateriaal te vinden als dat je nu een website of artikel kunt terugvinden.

Maar de werkelijkheid is anders. Bij het zoeken naar foto’s (met een Creative Commons licentie) op Flickr kom je de meest vreemde dingen tegen als je de zoekfunctie gebruikt. De foto hierboven kon ik alleen maar vinden omdat de uploader een grote tekst erbij geschreven had. Het zoeksysteem bij Flickr weet niet dat het een foto is van het hoofdkantoor van Google. Weet niet dat Google iets doet met zoeken. Het is puur gokken, ontdekken en je verbazen waarom je de meest onwaarschijnlijke foto’s aantreft bij een zoekactie.

In het onderwijs wordt er veel gebruik gemaakt van video. Maar een video zoeken, laat staan vinden, over een heel specifiek onderwerp vereist nog steeds dat je ofwel urenlang moet gaan snuffelen of je dat je enorm geluk moet hebben dat iemand dat onderwerp in een titel of beschrijving erbij gezet heeft. Waarom kan Facebook wel alle mensen in mijn foto’s herkennen maar kan ik bij Uitzending Gemist niet zoeken op videomateriaal waar een specifiek persoon in beeld is? Waarom kan Evernote wel teksten herkennen in de foto’s die ik daar plaats maar kan ik bij Flickr de bovenstaande foto niet vinden als ik op ‘Google’ zoek zonder dat iemand het erbij geschreven heeft?

Wanneer zorgen slimme mensen er nou eens voor dat ik dat allemaal wel kan?

@foto: Stuck in Customs via photopin cc

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

  • © 2006- 2014 Vakblog – werken met informatie
    Aangedreven door WordPress en liters koffie // Theme: Tatami van Elmastudio
Top