Zoeken naar tweets en wachten op een goed Twitter archief

tweettweet

Natuurlijk, er zijn genoeg manieren om je eigen tweets te archiveren en tweets met een bepaalde hashtag (of bepaalde woorden) erin te bewaren zodat je ze later nog kunt vinden of doorzoeken maar het blijft natuurlijk gewoon lastig dat je allerlei trucjes moet uithalen om tweets te zoeken terwijl je in Google wel miljoenen websites kunt vinden.

Het zullen echter miljarden tweets zijn in totaal en elke dag komen er miljoenen bij dus het is ook wel begrijpelijk ergens dat je niet even een zoekmachine bouwt waarmee je door 6 jaar aan tweets kunt zoeken. Twitter heeft zelf al moeite met meer dan een week aan tweets doorzoekbaar te maken en zelfs als het om je eigen tweets gaat zit je vast aan de inmiddels bekende grens van de laatste 3200 tweets die je nog kunt oproepen. Het blijft toch echter vreemd dat een grote informatiebron als Twitter zo ontzettend slecht doorzoekbaar is.

De bibliotheek pakt zijn rol
In april 2010 kondigde Twitter aan dat de Library of Congres de beschikking kreeg over het hele twitterarchief en daarmee was mijn hoop gevestigd dat op termijn dat hele archief ook mooi ontsloten en doorzoekbaar zou worden. Ik plaatste zelfs nog een tweet die ik daarna verwijderde om tzt te controleren of ik die terug kon vinden.

De Library of Congres, de nationale bibliotheek van Amerika, blijkt echter problemen te hebben om dit gerealiseerd te krijgen. In een rapportage (PDF) meldt de bibliotheek dat ze inmiddels beschikken over 170 miljard (publieke) tweets die ruim 133 TB opslagruimte innemen maar komen ook de voorwaarden naar voren in de overeenkomst met Twitter. De Library of Congres zou oorspronkelijk 6 maanden na de publicatiedatum van tweets deze ook toegankelijk moeten maken voor onderzoekers -ook weer onder voorwaarden overigens- maar ze mag dus niet (een deel van) het twitterarchief makkelijk downloadbaar maken vanaf bijvoorbeeld hun website.

De vertraging om de tweets doorzoekbaar en vindbaar te maken wordt veroorzaakt doordat de Library of Congres alle tweets moet (her)organiseren wat door de enorme hoeveelheden en door gebrek aan goede software (en ongetwijfeld budget) veel meer tijd kost dan verwacht. Bij The Verge is een artikel te lezen waarin bevestigd wordt dat bij een zoekactie door het volledige archief het op dit moment 24 uur kost voordat resultaten weergegeven worden, iets dat alleen met (veel) meer servercapaciteit opgelost kan worden.  Uit dat artikel wordt ook wel duidelijk dat het met de bezuinigingen niet te verwachten valt dat dit probleem op korte termijn opgelost gaat worden.

Twitter’s Twitter Archief
Als het alleen om je eigen tweets gaat dan was daar natuurlijk de belofte van Twitter zelf om persoonlijke archieven beschikbaar te gaan stellen voor iedereen met een account. Niet alleen de meest recentste 3200 tweets maar alles wat je ooit getweet hebt. Half december van vorig jaar meldde Twitter dat deze functionaliteit ook officieel uitgerold werd maar voor zover ik weet gebeurt dit vooralsnog op kleine schaal. Ik heb zelf die mogelijkheid in ieder geval nog niet, hoe vaak ik het ook controleer.

Nee, zoeken naar tweets zal voorlopig nog net zo lastig/onmogelijk blijven als dat het nu is. Voor je eigen tweets blijf je nog even aangewezen op tools als Tweet Nest waarmee je in ieder geval veel van je tweets kunt bewaren en doorzoeken. En nu maar wachten tot Twitter en de Library of Congres hun goede voornemens voor dit jaar kunnen waarmaken.

@ foto: id-iom via photopin cc

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (10) Write a comment

  1. Weet jij toevallig of het ook mogelijk is om je tweets makkelijk te verwijderen zonder je account op te zeggen. Ik vind twitter een zodanig vluchtig medium dat ik eigenlijk helemaal niet wil dat dat allemaal bewaard blijft.

    Reply

  2. Dank je voor de snelle feedback :-) Ik ga eens kijken.
    Mijn vraag komt niet zozeer voort uit privacy overwegingen maar ik voel me onbehaaglijk bij het idee dat al die tweets bewaard gaan worden. Ze zijn vaak in een opwelling geschreven en/of zijn niet meer dan flauwe grappen/opmerkingen/reacties n.a.v. andere flauwe/onzinnige/etc tweets. Dat is veel te veel ruis en zonde van de opslagcapaciteit. Het is verre van informatie. Of het moet gebruikt worden om bijvoorbeeld een tijdsbeeld en trends te distilleren.
    Ik zou ook niet willen dat alles wat ik zeg opgenomen en bewaard zou blijven.

    Reply

    • De meerderheid van alle tweets zullen persoonlijke tweets zijn of anders in de categorie flauw/onzinnig vallen maar ja, dat kun je ook zeggen over dagboeken en die geven inderdaad ook een mooi tijdsbeeld. Ik ben er inmiddels van overtuigd dat alle informatie een potentiele waarde heeft maar met persoonlijke dingen moet je wel – vooraf bij voorkeur- bedenken wat de impact ervan is.

      Gezien de moeilijkheden rondom tweets doorzoekbaar te maken verwacht ik niet dat er ooit een zoekmachine zal komen waar je alle tweets in terug kunt vinden dus ik denk dat je veilig bent, daar niet van ;)

      Reply

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top