Tweetweekoverzicht week 39 2018: Nog een keer CC Search, je telefoonnummer en Facebook, Google Images en de nieuwe Kobo Forma

vakblog tweetweekoverzicht
Elke week maak ik een tweetweekoverzicht waarin ik alsnog stil sta bij nieuws en interessante ontwikkelingen waar ik wel over getwitterd heb maar waar ik (nog) geen blogpost aan heb gewijd.

Ik weet niet of er gewoon wat minder nieuws was deze week dat mijn aandacht wist te trekken of dat het aan mij ligt (dat laatste gok ik) maar het was een beetje een mager nieuwsweekje. Het voordeel is dat je deze keer dus snel klaar bent ;-)

Nog een keer CC Search

Afgelopen week werd een nieuwe versie van CC Search, de metazoekmachine van Creative Commons die een aantal grote bronnen met foto’s doorzoekt die van een CC-licentie zijn voorzien, online gezet. Daar schreef ik weliswaar al een blogpost over maar ik wilde de zoekmachine ook hier nog even onder de aandacht brengen.

Behalve een nieuwe interface en het toevoegen van een aantal nieuwe bronnen – waardoor CC Search nu ca 10 miljoen foto’s doorzoekt – hebben ze de foto’s vooral beter doorzoekbaar gemaakt door ze automatisch van tags te laten voorzien. Dat werkt niet perfect natuurlijk maar je ziet hoe dit soort systemen steeds beter worden in het herkennen wat er op een foto staat. CC Search is nu echt een goede tool geworden om bijvoorbeeld in het onderwijs te gebruiken om geschikte foto’s te vinden voor in onderwijsproducten.

Je telefoonnummer en Facebook

Verrassend was het niet nee. Diverse media (zoals de NOS) meldden afgelopen week dat Facebook je telefoonnummer ook gebruikt om gericht mee te adverteren. Om precies te zijn laat Facebook toe dat adverteerders hun gegevens kunnen uploaden naar Facebook en, zodra telefoonnummers van potentiële klanten matchen met het nummer dat Facebook van je heeft, kan dat dus gebruikt worden om je als Facebook gebruiker te benaderen met advertenties.

Een werkwijze die logisch is voor een bedrijf dat zijn winsten uit advertenties haalt (hoe vaak moet je nog horen dat als je niet betaalt voor een product of dienst, JIJ het product bent?) maar wat wel kwalijk is omdat Facebook het afgelopen jaar gebruikers actief lastig viel met de vraag om voor beveiligingsredenen een telefoonnummer op te geven. En je een telefoon(nummer) gebruikt om twee-factor authenticatie te gebruiken als je inloggen met alleen een wachtwoord niet voldoende vindt.

Dat je gegevens van gebruikers, bedoeld voor de beveiliging van je eigen dienst, ook nog in zet voor advertenties is een kwalijke zaak want je zet mensen aan om geen gebruik te maken van beveiligingsmogelijkheden die in veel gevallen broodnodig en essentieel zijn. Ik weet tenminste dat het voor mij de reden is waarom ik geen twee-factor authenticatie aan heb staan voor Facebook. Want geef toe, dit was hogelijk voorspelbaar.

Google Images toont (soms) gebruiksrechten bij afbeeldingen

Op de Google Images site heb ik het nog niet kunnen terugvinden – een website die trouwens ook een nieuw jasje heeft gekregen met overzichtelijke(re) zoekresultaten – maar Google kondigde vorige week aan dat ze nu ook metadata bij foto’s gaan tonen die de maker en naamsvermelding laten zien.

Dat wil niet zeggen dat alle foto’s nu ineens magisch voorzien gaan worden van relevante informatie over wie ze gemaakt heeft. Het moet expliciet meegegeven worden in metadata bij de foto’s zelf volgens de IPTC metadatastandaard. En die moet weer expliciet ondersteund worden door de sites en fotodiensten die door Google geïndexeerd worden. Ik neem aan dat sites als Flickr het ondersteunen maar hoe groot die dekking precies is en of je straks ook echt vaker dit soort informatie gaat aantreffen, dat zullen we nog moeten zien.

Oh ja, over Google gesproken … die stonden afgelopen week even stil bij hun 20 jarig bestaan:

Kobo Forma

Ik was al flink aan het speculeren geslagen over de nieuwe Kobo ereader die volgende maand uit zou moeten komen. Ik was er van overtuigd dat ze met een Second Edition van de Aura ONE zouden komen maar dankzij een gelekte afbeelding van Kobo Spanje is het nu geen verrassing meer wat Kobo officieel volgende week gaat aankondigen.

De afbeelding stond maar eventjes online maar oplettende lezers waren er snel genoeg bij om de Spaanstalige advertentie alsnog te kunnen bestuderen. En hoewel je geen specificaties kunt afleiden van een dergelijke afbeelding wordt wel duidelijk dat Kobo zeer geïnspireerd is door de Kindle Oasis ereaders van Amazon.

De Forma lijkt namelijk erg op een Oasis maar dat is in dit geval ook niet erg want Kobo gaat daarmee eindelijk de kant op die ik hoopte en komt dus met bladerknoppen. Net als een Oasis (2) heeft de Forma een bredere zijkant waarin menu-/bladerknoppen verwerkt zijn en kan deze nu ook eindelijk het beeld draaien zodat je in landscape formaat kunt lezen. De Oasis 2 draait het beeld alleen 180 graden zodat je de ereader zowel met de linker- als rechterhand kunt vastpakken maar de Forma lijkt de bedoeling te zijn dat je hem over dwars kunt lezen.

De vraag hoe groot het scherm zal zijn (minimaal 8 inch neem ik aan want anders heeft in landscape lezen ook weinig toegevoegde waarde), wat de verdere specificaties en natuurlijk wat de prijs zal zijn, die krijg ik volgende week beantwoord als Kobo in Nederland een toelichting geeft op hun nieuwe ereader. Ik heb een uitnodiging hiervoor gekregen en ben ook in de gelegenheid om Michael Tamblyn, CEO van Kobo, rechtstreeks te vragen waarom de optie om woorden niet af te breken nog steeds ontbreekt in de Kobo ereaders.

#

Afbeeldingen zoeken: CC Search (september 2018 update)

death to the stock photo

Het valt nog niet mee om geschikte afbeeldingen of foto’s te vinden op internet voor je blog, website of presentatie. Er is veel te doen over auteursrechten op foto’s en je kunt problemen krijgen als je niet goed oplet en de verkeerde foto op je site gebruikt. Toch zijn er veel fotosites waar je goede foto’s kunt vinden die je ook daadwerkelijk mag gebruiken omdat rechthebbenden vooraf toestemming gegeven hebben. Dat kunnen betaalde stockfotosites zijn die je een gebruiksrecht voor een foto verkopen maar ook gratis fotosites die je middels een licentie toestemming geven voor (commercieel) hergebruik van foto’s.

Op dit blog vind je een overzicht van fotosites die ik besproken heb omdat ze allemaal goede foto’s bevatten zonder verstopte reclames en pogingen om je zo snel mogelijk naar de dure foto’s te verwijzen.

CC Search (september 2018 beta update)

In februari 2017 besprak ik al de eerste versie van CC Search, een zoekmachine die ontwikkeld is door de Creative Commons organisatie en waarmee je meerdere bestaande collecties met foto’s in één keer kan doorzoeken. Foto’s die voorzien zijn van een CC-licentie.

De CC Search beta is een nieuwe versie van de bestaande CC Search tool die al jaren aangeboden wordt op https://search.creativecommons.org. De oorspronkelijke CC Search is een meta-zoekmachine die je laat kiezen uit diverse (soorten) bronnen zoals muziek (o.a. ccMixter en Soundcloud), media (o.a. Europeana en Wikimedia) of afbeeldingen (o.a. Flickr en Pixabay). Je typt daar een zoekactie in en de meta-zoekmachine voert die zoekactie vervolgens uit bij de bronnen die je hebt aangevinkt.

Dat werkt redelijk maar het probleem is dat al die verschillende sites hele verschillende manieren hebben om duidelijk te maken of en welke CC-licentie er aan een werk gekoppeld is en dat je per gevonden zoekresultaat nog steeds moet controleren of de CC-licentie klopt.

De CC Search beta op https://ccsearch.creativecommons.org verhelpt dit probleem en kiest er voor om rechtstreeks met behulp van een API te koppelen met de bronnen zodat er een uniforme manier van zoeken en weergeven ontstaat. Om het ook uniform te kunnen houden is er eveneens voor gekozen om CC Search te beperken tot alleen bronnen met afbeeldingen. Dat is ook logisch want het wordt geschat dat, van de meer dan 1 miljard werken met een CC-licentie op internet, de helft foto’s en afbeeldingen zijn.

In februari 2017 begon CC Search met een vijftal bronnen (500px, Flickr, Metropolitan Museum of Art, New York Public Library en het Rijksmuseum) maar de update van deze maand breidt dit aantal fors uit terwijl ook 500px – die gestopt is met het aanbieden van CC foto’s – natuurlijk verwijderd is.

Vanaf deze maand doorzoek je met CC Search de volgende bronnen:

BronURL# CC Licensed Works
Animal Diversity Webhttps://animaldiversity.org/14.839
Behancehttps://www.behance.net/5.245.785
Deviantarthttps://www.deviantart.com/206.506
Digitalt Museumhttps://digitaltmuseum.org/88.970
Encyclopedia of Lifehttp://eol.org/547.488
Flickrhttps://www.flickr.com/426.214
Flora-Onhttp://flora-on.pt/26.498
Geograph UKhttp://www.geograph.org.uk/1.018.560
IHA Holiday Adshttp://www.iha.com/2.058.272
McCord Museumhttp://www.musee-mccord.qc.ca/en/108.800
The Metropolitan Museum of Arthttps://www.metmuseum.org/96.260
Museums Victoriahttps://collections.museumvictoria.com.au/64.719
Science Museum – UKhttps://www.sciencemuseum.org.uk/14.280

Zoeken met CC Search

cc search sep2018
De zoekinterface is flink veranderd sinds vorig jaar. Je kunt nu niet meer vooraf de bronnen selecteren (je doorzoekt nu alles en kunt pas daarna filteren) en de eenvoudige zoekbalk is nu omgeven door een voorbeeldfoto met CC-licentie.

cc search sep2018

Een eenvoudige zoekactie als ‘books’ levert ruim 9000 foto’s op die je eventueel nog kunt filteren (met de knop rechtsboven) op collectie, specifieke CC-licentie of het licentietype.

Bij collectie zijn (nog) niet alle bronnen opgenomen dus deze is daarom ook niet heel erg nuttig. Dat geldt ook voor het kiezen van een specifieke CC-licentie tenzij je een heel concreet en afgebakend gebruik voor ogen hebt. Licentie type daarentegen is heel handig want hier kun je bijvoorbeeld alle publiek domein foto’s (die over het algemeen erg oud zijn) eruit filteren maar ook juist alleen de foto’s overhouden die je commercieel mag gebruiken of die je mag bewerken.

Wat kun je met de gevonden foto’s en afbeeldingen?

cc search sep2018

Bij een CC-licentie staat hergebruik centraal en het is dus niet vreemd dat CC Search dit ook benadrukt. Onder elke gevonden foto of afbeelding wordt de titel, maker, licentie en bron vermeld [1]. Via de bronlink kun je ook meteen door naar de oorspronkelijke pagina in de bron zelf om te controleren of het echt wel klopt voordat je een foto bijvoorbeeld commercieel wilt gebruiken. CC Search waarschuwt in een balk onderin elk zoekresultaat ook dat ze niet kunnen garanderen dat een gevonden foto ook daadwerkelijk de CC-licentie (nog) heeft en dat je altijd moet controleren voordat je het gebruikt.

In de oude versie van CC Search werden de tags overgenomen als ze aanwezig waren in het bronbestand en kon je deze zelf aanvullen. Met behulp van een extern bedrijf worden nu alle geïndexeerde foto’s zelf automatisch voorzien van een flinke voorraad tags [2] waardoor je ook gemakkelijk verder kunt zoeken en doorklikken naar nieuwe zoekresultaten als je een interessante foto gevonden hebt.

Heb je de foto gevonden die je zocht (en heb je gecontroleerd of de CC-licentie klopt)? Bij ‘Photo attribution’ wordt al meteen een naamsvermelding weergegeven die linkt naar de titel, maker en licentie [3], en die je met één klik kunt kopiëren als tekst of als HTML zodat je die kunt plakken op je site, blog of andere plaats waar je de foto/afbeelding wilt gebruiken.

Conclusie

Er zijn ondertussen tientallen goede fotosites met een zeer uiteenlopend aanbod, zowel qua omvang als kwaliteit. Het is dan ook geen sinecure om te kiezen welke je wilt gebruiken want je gaat vast geen twintig sites aflopen om ‘even snel’ een foto te vinden voor een blogpost. Hoewel CC Search al die verschillende sites zeker niet overbodig maakt – Unsplash, Pixabay en StockSnap blijven favoriet bij mij – is het wel superhandig om al die miljoenen foto’s met een CC-licentie op één plek bij elkaar te hebben.

Alleen de mogelijkheid om in één makkelijke zoekmachine het aanbod van Flickr van foto’s-met-CC-licenties te kunnen doorzoeken maakt CC Search al de moeite waard. Dat je ook nog met 1 klik de correcte naamsvermelding kunt kopiëren is een fijne bonus omdat die het net wat makkelijker maakt om foto’s opnieuw te gebruiken.

CC Search blijft een beta waar Creative Commons nog aan blijft sleutelen maar deze update maakt een mooie en handige zoekmachine nog een stuk beter dankzij de uitbreiding van bronnen en de verbeterde zoekmogelijkheden met tags.

#

google dataset search header

Google Dataset Search: googelen naar onderzoeksdata

Deze week kwam Google met een nieuwe zoekmachine: Google Dataset Search. Deze zoekmachine moet de miljoenen datasets die in duizenden datarepositories wereldwijd opgenomen zijn (en tegenwoordig ook door overheden openbaar gemaakt worden) nu eindelijk eenvoudig vindbaar gaan maken. 

Van gesloten naar open

Er wordt wereldwijd enorm veel onderzoek verricht. Dat onderzoek levert natuurlijk heel veel onderzoeksresultaten op. Dat zijn vaak artikelen die in (dure) vaktijdschriften gepubliceerd worden en die door wetenschappelijke uitgevers in (al net zo dure) databanken gestopt worden die vervolgens door universiteiten en onderzoeksinstellingen weer afgenomen worden.

Maar ja, dat betekent dat al die onderzoeksresultaten in databanken opgesloten zit en dat je er alleen maar aan kunt komen als jouw instelling toegang gekocht heeft tot de artikelen van de specifieke uitgever waar die artikelen ooit door gepubliceerd zijn.

Nou is er al jaren een beweging gaande om alle onderzoeksresultaten, die met publieke middelen gefinancierd zijn, vrij toegankelijk te maken voor iedereen. Open access publiceren betekent dat artikelen in repositories van onderwijs- en onderzoeksinstellingen geplaatst kunnen worden (en gratis te raadplegen zijn) maar ook dat wetenschappelijke uitgevers de artikelen vrij toegankelijk maakt voor iedereen die daar in geïnteresseerd is. Dat laatste gaat overigens nog met grote tegenzin van de uitgevers en leidde deze week ook al tot de aankondiging door 11 Europese onderzoeksfinanciers dat open access publiceren nu een verplichting wordt.

Los van de uitdaging om open access publiceren te stimuleren ontstaat er ook een uitdaging om al die publicaties eenvoudig te kunnen vinden. Immers, als deze in duizenden repositories en op duizenden websites geplaatst worden, hoe vind je ze dan terug? De ultieme oplossing is er eigenlijk niet maar met Google Scholar doet Google in elk geval zijn best. Google indexeert de websites sowieso al natuurlijk en door gebruik te maken van de webstandaarden voor de repositories kan Google ook de metadata van de publicaties in de repositories meenemen.

Onderzoeksdata

Voordat er een publicatie (of welk onderzoeksresultaat er uit onderzoek voortvloeit) tot stand komt, wordt er echter ook data geproduceerd in onderzoek. Heel veel data zelfs. Alle resultaten van metingen, gesprekken/interviews, statistieken, enquêtes enz die gedaan worden tijdens het onderzoek bijvoorbeeld.

Tegenwoordig wordt onderzoeksdata ook steeds vaker beschikbaar gemaakt in datarepositories (zoals EASY) vanuit hetzelfde open access idee en maken (lokale) overheden de door hun verzamelde data ook vrij toegankelijk voor iedereen. De rijksoverheid heeft zelfs een apart dataportaal ingericht waar je de meest uiteenlopende datasets kunt vinden. Van de omzet van importeurs van personenwagens tot een register van toegekende telefoonnummers.

Vanzelfsprekend is het geweldig dat er zo veel datasets op het internet staan. Ze kunnen door onderzoekers (voor nieuw onderzoek) en/of door journalisten (voor de onderbouwing bij onderzoeksjournalstiek) gebruikt worden. Mits ze eenvoudig gevonden kunnen worden en dat was altijd een probleem. Datasets zijn vaak meerdere bestanden, in een grote verscheidenheid aan bestandsformaten, die gebundeld zijn in een ZIP bestand. Een zoekmachine kan deze niet herkennen als datasets zonder dat ze met metadata expliciet zijn gemarkeerd als datasets.

Gestandaardiseerd

Nou bestaat er wel degelijk een metadata standaard die specifiek voor datasets ontwikkeld is. Schema.org – een initiatief dat in 2011 door o.a. Microsoft en Google is gestart – houdt zich bezig met het ontwikkelen van standaarden voor gestructureerde gegevens op het web en heeft de metadata voor datasets gestandaardiseerd in een eigen schema.

Eind juli kondigde Google aan deze standaard nu te implementeren in de zoekmachine zodat ook datasets (beter) getoond worden in de zoekresultaten maar deze week kwamen ze onverwachts ook met een aparte zoekmachine die zich specifiek en alleen richt op het vindbaar maken van datasets: Google Dataset Search. Het heeft als doel om alle datarepositories – die voldoen aan de dataset standaard en vindbaar zijn voor Google – te indexeren zodat je op één plek miljoenen datasets kunt doorzoeken.

Google Dataset Search

Een eigen subdomeinnaam heeft Google Dataset Search nog niet en in de aankondiging gebruikt Google ook een redirect url g.co/datasetsearch om te verwijzen naar de zoekmachine die thans op toolbox.google.com/datasetsearch te vinden is.

google dataset search
De interface is, zoals je van Google gewend bent, extreem eenvoudig zonder mogelijkheid om geavanceerd te zoeken. Er worden twee voorbeeldzoekacties gegeven waar je uit kunt afleiden dat in elk geval de datasets van de National Oceanic and Atmospheric Administration te vinden zijn maar verder is het onduidelijk welke repositories/instellingen er wel of niet zijn opgenomen.

google dataset search

Begin je echter met het tikken van een (Nederlandstalige) zoekterm, dan blijken er meer dan alleen Amerikaanse datarepositories opgenomen te zijn. Ik heb niet geprobeerd om een uitputtende lijst te maken maar EASY (DANS) en de datasets van de Nederlandse gemeentes en overheid lijken vindbaar te zijn in Dataset Search.

google dataset search
De weergave van de zoekresultaten is eveneens redelijk summier. De websites/repositories waar de dataset te vinden is wordt meteen onder de titel aangegeven [1] zodat je gelijk kunt doorklikken en als de dataset onder een andere titel elders te vinden is dan krijg je in de linkerkolom de overige vindplaats(en) te zien [2].

Verder zie je de standaard metadatavelden, mits ze aanwezig zijn, zoals o.a. de publicatiedatum, gebruikslicentie, downloadformaten en de beschrijving van de dataset.

Google roept ook iedereen op om hun datarepositories maar vooral ook eigen websites met datasets vindbaar te maken voor Dataset Search en verwijst naar meer informatie hierover voor beheerders en webmasters. Er is zelfs een tool beschikbaar waarmee bijvoorbeeld onderzoekers zelf hun eigen website kunnen (laten) voorzien van de HTML tags om datasets vindbaar te maken voor Google.

Nog maar het begin

Google benadrukt dat Dataset Search een pilot is dat de komende maanden en jaren nog verder vorm moet krijgen. Het ligt dan ook voor de hand dat de interface, wat er en hoe het getoond wordt en ook de URL allemaal nog gaan veranderen.

Hoewel het op één plek kunnen vinden van datasets een enorm voordeel kan zijn, wil dit niet zeggen dat Google Dataset Search nu al de beste plek is om onderzoeksdata te vinden. De dataset uit het hierboven gebruikte voorbeeld van de bodeminformatie onderzoeken is afkomstig van het dataportaal van de gemeente Breda en daar verwijst Google ook keurig naar. Dezelfde dataset is echter ook ontsloten via het dataportaal van de Nederlandse overheid die je de gegevens meteen laat downloaden zonder verdere verwijzingen.

Google heeft nog wel werk te verrichten maar Dataset Search gaat ongetwijfeld net zo bekend worden als Scholar dat nu is. Je kunt nu immers eindelijk googelen naar onderzoeksdata.

#

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top