Twitter: listening to a kitchen table conversation involving 17 million people tijdens de #srie13

Gisteren vond het SURF Research and Innovation Event 2013 plaats bij de Haagse Hogeschool. Zo’n 250 geïnteresseerden kwamen naar Den Haag toe om meer te horen over o.a. (innovatief) gebruik van ICT bij onderzoek en onderzoeksdata. Met twee keynotes en vier te volgen sessies binnen eveneens vier tracks was er voldoende variatie voor iedereen, ongeacht je achtergrond en interesses. Zelf heb ik de eerste keynote bijgewoond, net als twee sessies in de vierde track over citizen science & social media. Er is door aanwezigen (en organisatie) flink getwitterd met de hashtag #srie13 dus ook hier kun je nog even terugblikken.

Als je vaker dit blog gelezen hebt dan was het je niet ontgaan dat ik erg geïnteresseerd ben in archiveren, visualiseren en vooral analyseren van Twitter data. Het feit dat zo ontzettend veel mensen dagelijks zo ontzettend veel tweets produceren betekent dat het enorm interessant kan zijn om naar die tweets te kijken qua taalgebruik, actualiteit en in historisch perspectief. Stiekem was de tweede presentatie in de track citizen science & social media van Erik Tjong Kim Sang over de analyse van alle Nederlandse en Nederlandstalige tweets dan ook de reden voor mij om naar de #srie13 te gaan.

Ik kon mijn hart ophalen in elk geval.

Genoeg data levert Twitter in elk geval wel voor Erik want ook al heb je maar maximaal 140 tekens in een tweet, alleen al in Nederland zijn er bijna 2 miljoen twitteraars die dagelijks tussen de 3 en 4 miljoen tweets produceren. Hij neemt hierbij de Nederlandstalige tweets mee door te selecteren op een aantal ‘typisch’ Nederlandse woorden maar ook alle tweets van de 5000 meest productieve twitteraars. Na die selectie blijven er dan dagelijks 2 miljoen tweets over.

Het project TwiNL waar Erik aan werkt heeft als doel om al die Nederlandse tweets te verzamelen, deze doorzoekbaar te maken en een aantal views op die data erbij te geven.

twiqs

Doorzoekbaar zijn de verzamelde tweets inderdaad al vanaf december 2010 via de ontwikkelde zoekmachine Twiqs. Je kunt tweets op trefwoorden doorzoeken en alleen afbakenen op datum (of een periode)

Een zoekactie vandaag op hoeveel tweets er gisteren verstuurd zijn met de #srie13 hashtag levert, na een behoorlijk poosje wachten tot de server de 5 TB aan tweets doorzocht heeft, een selectie van 39 tweets op.

twiqs_srie13

De piek is te zien rond 10.30 en dat correspondeert met het begin van de presentatie van Leo Kouwenhoven. Het aardige is dat je behalve de grafiek in het menu ook kunt kiezen voor een kaart (waarin de aanwezige locatiegegevens zijn gevisualiseerd), woorden, gebruikers en de tweets zelf.

Vooral de gebruikers zijn leuk om te zien :)

twiqs_srie13_users

Erik gaf zelf ook voorbeelden van zoekresultaten in zijn presentatie. Een grafiek waarbij naar diverse trefwoorden is gezocht die met eten te maken hebben. Niet verrassend komen daar pieken te voorschijn rond half 8 in de ochtend, half 1 en 6 uur ‘s avonds. Interessant was ook de kaart die ontstaat bij het zoeken op ‘vast en zeker’ en ‘zeker en vast’. De regionale verschillen in het afwijkende gebruik van die uitdrukking kwamen netjes te voorschijn.

Het mooiste voorbeeld was wel een bewegende kaart die gemaakt was door op de locaties van tweets te letten waarin het woord ‘sneeuw’ voorkwam. Er ontstond een kort filmpje, vergelijkbaar met de buienradar, waarin het gebied waarin over sneeuw getwitterd werd langzaam vanuit het westen naar het oosten van het land trok. Een meteorologische toepassing zonder dat er meteorologische data aan te pas komt.

Geweldig toch?

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (9) Write a comment

  1. Je haalt me de blogpost uit de mond… ;-) Ook mijn ervaring vandaag met Twiqs was dat het allemaal wel lang duurde. Al die congresgangers van gisteren waren natuurlijk druk bezig. En dat filmpje is inderdaad fraai: Hier op YouTube.

    Reply

    • Ik wilde al even een (flauwe) verwijzing maken dat die Sara server beter een quantum computer had kunnen zijn maar die bewaar ik dus nu maar voor de comments ;)

      Dank voor de link naar het filmpje!

      Reply

  2. Pingback: » Presentation at SRIE13 TwiNL

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top