Check ze tweets : meer Twitter nieuws

Vlak nadat Google op het blog aankondigde het gehele Twitterversum toegankelijk en doorzoekbaar te gaan maken, volgt de geliefde microblogdienst met het bericht dat de miljarden tweets voor de eeuwigheid geconserveerd gaan worden door de Library of Congress. Ook ‘s werelds grootste bibliotheek blogde zelf over deze ontwikkeling.

Tijdens het NVB congres van 2009 hield Bas Haring nog een keynote presentatie waarin hij (o.a.) beargumenteerde dat ook vluchtige real time informatie als tweets waardevol konden zijn. Hij illustreerde dat met een (fake) voorbeeld maar als idee vond ik het best intrigerend, zeker omdat ik er zelf nooit zo zeer over de informatieve waarde van tweets had nagedacht in deze context. Nauwelijks een half jaar later is het al realiteit geworden en zijn miljoenen twitterende mensen ineens informatieleverancier. Via Google te vinden en voor de eeuwigheid bewaard bij de Library of Congress.

De eerste gedachte die bij mij opkwam was dat die miljarden tweets natuurlijk eeeeeenorm veel bagger bevatten. Honderdduizenden tweets in vele varianten die goeiemorgen, goeiemiddag of goeieavond zeggen. Voeg daar minstens x keer zo veel tweets met nutteloze spamberichten aan toe en je krijgt de vraag vanzelf of ze gaan selecteren in de tweets. Aan de ene kant lijkt me dat wenselijk, inclusief de optie voor twitteraars om hun tweets niet vereeuwigd te willen zien wellicht. Aan de andere kant is het onmogelijk om hele duidelijke criteria te formuleren die alle discussies gelijk zouden beslechten. Plus, is het aardige van zo’n collectie tweets juist niet dat het volledig is en dus ook de onzin en spam bevat? Wie zegt dat over 50 jaar er niet diverse onderzoeken plaats gaan vinden over commercie en spam via microblog en sociale sites die in het begin van deze eeuw zo populair waren?

Als we het toch over onderzoek hebben: laat ik een kleine test doen om te kijken hoe zowel Google als de Library of Congress omgaan met tweets die na korte tijd verwijderd zijn door de twitteraars. Een uurtje geleden heb ik de onderstaande tweet de wereld in gestuurd. Ik verwijder deze zometeen en kijk straks, als beide instellingen gereed zijn met hun implementatie, of ik deze specifieke tweet wel of niet kan terugvinden. Moet ik echt beter gaan nadenken voordat ik een tweet verstuur of helpt een trigger happy vinger op de delete knop me nog om toekomstige genante situaties te vermijden?


Wordt later vervolgd …

Hoe dan ook, ik kan nu wel zeggen dat ik met meer dan 3000 korte publicaties straks in de collecties van de Library of Congress terug te vinden ben. Dat is toch eigenlijk best stoer, nietwaar?

MARC 21 catalogiseren

Cataloblog meldde eergisteren dat de Library of Congress de volledige documentatie van alle 5 de MARC 21 formaten online had gezet. Een ingekorte versie stond er altijd al van de bibliographic en authority formaten maar nu kan iedere MARC 21 catalogiseerder zijn hart ophalen met deze online documentatie.

Nu zullen weinig mensen in Nederland hier geinteresseerd in zijn aangezien de tijd voorbij is dat je met een boek, of welk materiaal dan ook, in de hand een precieze beschrijving gaat maken in MARC, zoekende naar de best passende velden en subvelden. Zelf had ik het genoegen dit te doen (en te leren over MARC 21 dat toen nog USMARC heette) tijdens het jaartje dat ik Documentaire Informatiekunde studeerde aan de UvA. Met verkorte handleidingen in de hand mochten we muismatjes en boeken gaan beschrijven in dit formaat en ik dacht nog, is hier werkelijk nog 1 praktische toepassing voor?

Dat heb ik geweten want nauwelijks een half jaar daarna mocht ik aan de slag als projectleider van de bibliotheekautomatisering in Enschede mbv het bibliotheeksysteem GeacPlus. In tegenstelling tot andere systemen moest je hierin werkelijk alles zelf definieren en instellen, en dat was inclusief de bibliographische en authority formaten voor de materialen die je in wilde voeren. Om een lange post kort te maken, heb ik maanden besteed aan het puzzelen met MARC velden om een stuk of tien invoerformaten op te stellen waarin we al onze materialen kwijt konden.

Ook al is het inmiddels 12 jaar geleden, is GeacPlus geen verkocht bibliotheeksysteem meer in Europa en werk ik inmiddels al jaren bij een andere hogeschool, tot de dag van vandaag ken ik de meeste velden nog uit mijn hoofd en kan ik toch even met weemoed terugdenken als ik zo’n bericht over MARC 21 zie.

Library of Congress en Flickr samen op de foto

Op het Library of Congress blog was te lezen dat de LoC een pilot gestart is om hun gigantische collectie foto’s beter toegankelijk te maken en te voorzien van metadata. Interessant genoeg hebben ze ervoor gekozen dit samen met Flickr te doen en inmiddels zijn 3000 foto’s uit de twee populairste collecties van de LoC beschikbaar via de eigen Flickr pagina.

2179139371_5b022a88ae_m.jpg

Niet alleen worden alle bezoekers & Flickr gebruikers gestimuleerd om tags en comments toe te voegen, alle foto’s zijn volledig vrij van copyright en daarmee vrijelijk te gebruiken. Flickr heeft in het kader van deze pilot ook een aparte subsite ingericht als publicatiemodel voor instellingen die hun fotocollecties op deze manier beschikbaar willen maken: Flickr Commons, natuurlijk met het idee om meer instellingen te stimuleren deel te nemen.

Een prachtig initiatief, niet alleen doordat er nu duizenden mooie foto’s beschikbaar zijn gekomen maar natuurlijk ook interessant door de keuze van de Library of Congress om de folksonomy methode toe te passen bij het metadateren van hun fotocollectie.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top