Open data en het gebruik van data in het GGC en WorldCat

Gisteren was ik aanwezig bij een bijeenkomst van de Stichting Pica Database in Utrecht. Met de titel Gebruik van data in het GGC en WorldCat: wat is toegestaan op grond van de nieuwe regeling? was het niet heel verrassend dat er slechts enkelen vanuit de hogescholen vertegenwoordigd waren. Mijn eigen aanwezigheid werd desondanks niet vreemd bevonden en dat was ook wel bijzonder als je bedenkt dat mijn instelling geen afnemer/gebruiker is van het GGC of Worldcat en hogeschoolbibliotheken, voor zover ik weet, weinig tot niets doen met data uit deze databases.

Reden voor de bijeenkomst was de nieuwe regeling t.a.v. het gebruik van data uit de twee databases die men toe wilde lichten en men had het programma ook nog uitgebreid met een presentatie van Lieneke Viergever over privacy aspecten bij gebruiken van data bij clouddiensten en een dubbelpresentatie van Johan Stapel en Eric van Lubeek over linked open data en wat het voor OCLC betekent, als eigenaren van GGC en Worldcat.

Ik heb de eerste presentatie over de geschiedenis en rol van Stichting Pica en Stichting Pica Database voor kennisgeving aangenomen en de tweede presentatie van Dorien Hooman, die de nieuwe regeling daadwerkelijk toelichtte als een opstapje beschouwd voor de reden dat ik eigenlijk aanwezig was. Namelijk een beetje zicht krijgen op het fenomeen (linked) open data en dan vooral de juridische en auteursrechtelijke aspecten ervan.

Ik werd na de koffiepauze op mijn wenken bediend door Lieneke Viergever, advocate bij Project Moore,  die behalve de privacy aspecten rondom clouddiensten ook nog een zijstapje maakte naar definiëring van open data (via Open Definition):

“A piece of content or data is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”

Heel kort, helaas, verwees ze nog naar de Open Data Commons die het mogelijk maken om, vergelijkbaar met de Creative Commons voor content, open data te voorzien van een licentie. Voor de data uit het GGC en Worldcat plakt OCLC de Open Data Commons Attribution License er op waarbij de data dus vrijelijk hergebruikt kan worden mits er aan (naams)vermelding wordt gedaan. De spreker voor haar, Dorien Hooman, bevestigde dat dit wel een discussie/onderhandeling opleverde tussen OCLC en Europeana aangezien deze laatste een volledig vrij gebruik nastreeft -zonder naamsvermelding-.

Johan Stapel verduidelijkte nog de betekenis en het belang van Linked Open Data en introduceerde het publiek tegelijkertijd met de Pecha Kucha stijl van presenteren waarin 20 slides telkens (precies) 20 seconden in beeld bleven waardoor hij keurig binnen de 7 minuten zijn verhaal kon afronden. Eric van Lubeek, de managing director van OCLC EMEA ken ik vooral van de uitgebreide schema’s in zijn presentaties en hij ging dan ook wijselijk zelf niet met de Pecha Kucha stijl van presenteren verder. Wel demonstreerde hij de rol en betekenis van open data voor OCLC EMEA aan de hand van de ontwikkeling van een nieuwe dienst, Worldshare Platform.

Hoewel dit platform, GGC en Worldcat niet direct relevant zijn voor mezelf, vind ik het hele idee van open data fascinerend. Open standaarden, harmonisatie en afstemming, de techniek erachter maar ook de auteursrechtelijke en licentie aspecten die erbij horen zijn alle zaken die voor ons vakgebied van informatievoorziening enerzijds nieuw zijn maar anderzijds stoelen op hele oude principes uit het bibliotheekwezen.

Wat hebben we toch een geweldig vak!

@ foto via Cool Breakfast

#

TEDTalk William Noel: Revealing the lost codex of Archimedes

William Noel vertelt uitgebreid hoe een palimpsest, een hergebruikt perkament waarbij in dit geval maar liefst 7 documenten gerecycled werden, weer ontcijferd werd in de oorspronkelijke documenten omdat 1 ervan een codex van Archimedes was. Behalve een fraai staaltje boekrestauratie is het tevens een pleidooi om de data, die uit dit soort digitaliseringsprojecten komen, wereldwijd vrijelijk beschikbaar te maken voor het publiek onder een Creative Commons licentie.

Zoals Noel terecht stelt in zijn verhaal, de beste manier om boeken duurzaam te bewaren is om ze weg te stoppen en te zorgen dat zo min mogelijk mensen te daadwerkelijk lezen. De beste manier om data duurzaam te bewaren is echter om het zo breed mogelijk te verspreiden met zo min mogelijk restricties.

The Web of ancient manuscripts of the future isn’t going to be built by institutions. It’s going to be built by users … people who just want to curate their own glorious selection of beautiful things. (William Noel)

How do you read a two-thousand-year-old manuscript that has been erased, cut up, written on and painted over? With a powerful particle accelerator, of course! Ancient books curator William Noel tells the fascinating story behind the Archimedes palimpsest, a Byzantine prayer book containing previously-unknown original writings from ancient Greek mathematician Archimedes and others.

William Noel is a curator who believes museums should make their collections free and available on the Internet.

@ TEDTalks are distributed under a Creative Commons (CC) license.

#

Over het seminar Onderzoeksdata: wat kan, mag en moet

Gisteren vond bij de NWO het door SURFacademy georganiseerde Seminar Onderzoeksdata: wat kan, mag en moet plaats. Uit de aankondiging:

Transparantie in het wetenschappelijk onderzoek is een veelbesproken onderwerp. In hoeverre kan, mag en moet onderzoeksdata inzichtelijk en toegankelijk zijn? Voor valorisatie en voor hergebruik is open toegang tot onderzoeksdata belangrijk. Steeds meer onderzoeksinstellingen vragen om het beschikbaar maken van de onderzoeksdata. Zowel om de conclusies, zoals opgetekend in een wetenschappelijke publicatie, te kunnen verifiëren als om efficiënt (her)gebruik van onderzoek mogelijk te maken.

Financiers als de Europeese Unie en NWO geven aan dat een onderzoeker zijn/haar publiek gefinancierd onderzoek open beschikbaar maakt. Maar hoe doe je dat? Wat kan, mag en moet?

Dit seminar biedt u inzichten in enerzijds het beleid van NWO ten aanzien van openbaarheid van onderzoeksdata. En anderzijds krijgt u inzicht in de mogelijkheden en beperkingen van de Auteurswet voor het hergebruik van onderzoeksdata.

Met onderzoeksfinanciering heb ik zelf niets van doen aangezien dit aspect in het HBO zich buiten mijn waarneming afspeelt en het onderwerp van open onderzoeksdata en open access sowieso daar nog in de kinderschoenen staat. De auteursrechtelijke aspecten bij hergebruik van onderzoeksdata daarentegen leken me wel bijzonder interessant en kennelijk was ik daar niet alleen in. Onder de meer dan 80 bezoekers waren misschien maar nipt 10% afkomstig uit het HBO en kwam de meerderheid vanuit de universiteiten, er waren veel collega’s van de Auteursrechten Informatiepunten van beide. Het bleek uiteindelijk ook een leuke mix te zijn in de zaal met bezoekers vanuit onderzoeksinstituten.

Het programma opende met Ron Dekker, directeur Instituten, Financien en Infrastructuur van de NWO die aan de hand van de missie toelichtte hoe de NWO omgaat (PDF) met en stuurt op hergebruik en toegankelijkheid tot de datasets. In de nieuwe NWO-Regeling Subsidies is nu expliciet opgenomen dat de NWO mede eigenaarschap kan claimen t.a.v. data die voortkomt uit door NWO gesubsidieerd onderzoek. Onder de noemer Wie betaalt, bepaalt wil de NWO het belang van delen van onderzoeksdata beter onder de aandacht brengen en heeft men tegelijk een middel in handen om te voorkomen dat het eigenaarschap van de data wordt overgedragen aan commerciële partijen.

De auteursrechtelijke aspecten rondom ruwe data en datasets werden vervolgens toegelicht door Madeleine de Cock Buning, hoogleraar Auteurs- Communicatie- en Mediarecht bij CIER en Commissaris bij de Commissariaat voor de Media. Ze werd geïntroduceerd als de expert op dit gebied en hoewel ze dit poogde te relativeren was het al snel duidelijk dat het eerder een understatement was. Op een aanstekelijke enthousiaste wijze en met gevoel voor humor verduidelijkte ze de juridische uitgangspositie (PDF) van onderzoeksdata aan de hand van het auteursrecht, het databankenrecht en de onpersoonlijke geschriftenbescherming. Zowel het rapport ‘De juridische status van ruwe data; een wegwijzer voor de onderzoekspraktijk’ (2009) als het recent verschenen rapport Data in Publiek-Private Projecten: Juridische aspecten (2011) is mede van haar hand en gaan uitgebreid in op al die juridische aspecten.

Na een intermezzo waarin Annemiek van der Kuil de zojuist opgedane kennis in de zaal toetste was het de beurt aan Wilma Mossink, juridisch adviseur bij SURF, die verder inging op het eigenaarschap van data (PDF). Aan de hand van een schema, waarin de vele processen waren opgenomen om te komen tot het verzamelen, bewaren en archiveren van onderzoeksdata, lichtte ze lopende ontwikkelingen en studies toe. Deze zijn allemaal te vinden op de Toegang tot onderzoeksdata site van SURFfoundation.

Heiko Tjalsma, specialist digitale archivering bij DANS, gaf daarna aan hoe er in de praktijk om wordt gegaan (PDF) met opslaan, archivering en beschikbaarstelling van onderzoeksdata en de bijbehorende licenties. Ondanks alle goede intenties bleken er ook voldoende valide redenen te zijn om vertrouwelijk om te (blijven) gaan met data en DANS zoekt dus ook een balans tussen een optimale vrije toegankelijkheid en selectief toegang geven tot vertrouwelijke informatie.

Over licenties ging het laatste blok dan ook (PDF) en Madeleine de Cock Buning concludeerde dat bestaande licenties niet goed passen bij open onderzoeksdata. Ze raadde aan om IE-rechten geen obstakel te laten zijn voor delen en hergebruiken van onderzoeksdata en bepleitte een gedragscode bij onderzoeksinstituten en onderzoekers ipv een stelsel van licenties om flexibeler te zijn in de ontwikkelingen die nog steeds gaande zijn t.a.v. onderzoeksdata. Wilma Mossink ging, desalniettemin, afsluitend in op de Open Data Commons licenties die aan onderzoeksdata meegegeven kunnen worden.

Al met al een interessante middag over een onderwerp waar ik na afloop aanzienlijk meer over wist dan vooraf. Dat is voor mij het bewijs voor een geslaagd seminar en hoewel ik niet, zoals Madeleine suggereerde, de Berlin Declaration uitgeprint boven mijn bed heb hangen is het aspect open data binnen open access voor mij nu een stuk duidelijk geworden, ook om te vertellen aan anderen. Ook deze kennis moet gedeeld worden, niet waar?

@foto via RGBstock
  • © 2006- 2014 Vakblog – werken met informatie
    Aangedreven door WordPress en liters koffie // Theme: Tatami van Elmastudio
Top