Slimmer zoeken naar (Google+) foto’s met Google Zoeken

slimmer zoeken google photo search

Vorig jaar verzuchtte ik nog dat ik niet kon snappen waarom je nog steeds geen foto’s kon zoeken met een zoekmachine. En dan bedoel ik niet aan de hand van tags die je aan foto’s kunt toevoegen – of die Google binnenkort automatisch aan foto’s wil laten toekennen – maar via echte beeldherkenning. Er bestaan al lang hele slimme systemen die zelf (redelijk) kunnen vaststellen wat er op een foto afgebeeld staat. Systemen die alleen maar beter worden naar mate ze meer foto’s ‘bekeken’ hebben. Slimmer zoeken met behulp van slimme zoeksystemen, hoe moeilijk kan dat nou zijn tegenwoordig?

Hoewel je nog steeds niet in Google op zoek kunt gaan naar alle foto’s op het internet, kun je wel sinds gisteren op zoek gaan in de Google zoekmachine naar je eigen foto’s die je op Google+ hebt geplaatst. En die van je vrienden op Google’s sociale netwerk.

Starting today, you’ll be able to find your photos more easily and connect with the friends, places and events in your Google+ photos. For example, now you can search for your friend’s wedding photos or pictures from a concert you attended recently. To make computers do the hard work for you, we’ve also begun using computer vision and machine learning to help recognize more general concepts in your photos such as sunsets, food and flowers.

Goed, je moet wel gebruik maken van Google.com (dus let op dat je niet automatisch wordt doorverwezen naar google.nl want daar werkt het niet) en je moet ingelogd met je Google+ account maar dan kun je gaan kijken welke foto’s Google terug weet te vinden uit jouw albums. Het werkt overigens/natuurlijk ook vanuit Google Photo’s in Google+.

Zoeken op ‘my photos‘ geeft je bovenaan de zoekresultaten een nieuw onderdeel met Photos from you and your friends op Google+ waar je in eerste instantie je eigen foto’s kunt zien en na doorklikken verder kunt zoeken in de foto’s die door je vrienden geplaatst zijn.

Google ziet wat jij niet ziet. En andersom
Natuurlijk is de beeldherkenning best wel beperkt. Google herkent maar een miniem percentage van wat er op al die miljoenen foto’s afgebeeld staat en je kunt aan je foto’s ook niet zien wat Google er precies wel of niet in ziet. Dat betekent dat je eigenlijk een beetje moet gaan raden en gokken met welke zoekacties welke foto’s naar boven komen drijven.

Ik heb behalve enkele foto’s van mijn kinderen eigenlijk alleen maar 1 album op Google+ staan met tientallen foto’s van een vakantie in Ierland. Zoeken op ‘my photos of a lake‘ levert wel de meeste foto’s op waar je ook daadwerkelijk een meertje op ziet. Zoek je vervolgens op ‘my photos of a river‘ dan krijg je nog steeds een paar van die foto’s terug en dat worden er zelfs nog iets meer als ik zoek op ‘my photos of a sea‘. Google kijkt vooral naar de (procentuele?) aanwezigheid van water op een foto denk ik. Ik dacht pienter te zijn en dan eens te gaan zoeken op ‘my photos of water‘ maar dat bracht om onverklaarbare redenen slechts 1 zoekresultaat: een foto van mijn dochtertje :)

slimmer zoeken google photo searchIk was ook wel benieuwd of Google uberhaupt een link met Ierland kon leggen in mijn foto’s (en nee, ik heb geen geotags aan die foto’s hangen) en waarempel, 1 foto werd herkend als zijnde (in) Ierland!

Heel erg betrouwbaar zal het nu allemaal nog niet zijn maar het is wel een leuk en mooi begin van wat ongetwijfeld over enkele jaren de normaalste zaak van de wereld zal zijn. Dan zijn die systemen slim genoeg om iedereen foto’s en afbeeldingen te laten vinden aan de hand van wat er op afgebeeld staat.

Geweldig toch?

#

Google Scholar voor de beginnende (onder)zoeker

google scholar

Heel veel deed ik tot nu toe nog niet met Google Scholar moet ik toegeven. Dat komt vooral omdat ik maar zelden op zoek ben naar wetenschappelijke artikelen of andere bronnen. In het HBO zijn kenniskringen en lectoraten echter nu al geruime tijd bezig met (praktijkgericht) onderzoek en vooral hoe zowel dit onderzoeksproces als de resultaten ervan terug kunnen vloeien naar het onderwijs zelf. Dat houdt o.a. in dat steeds meer docenten wel op zoek gaan naar wetenschappelijke literatuur en zoals Google zoeken synoniem is voor zoeken op het internet, is Google Scholar al snel gevonden door een onderzoeker die een artikel of boek zoekt.

Toegang en zoekvaardigheden
De vergelijking met de Google zoekmachine is op meer punten te maken. De meeste mensen tikken daar een paar zoektermen in en vertrouwen er op dat Google de meest relevante resultaten teruggeeft. En dat zie je ook terug als mensen voor het eerst Google Scholar gaan gebruiken. Er worden zoektermen ingetikt, Google Scholar komt terug met een aantal resultaten maar ongetwijfeld niet met het artikel dat je zocht. Het zal je in de Google zoekmachine niet heel veel uitmaken hoe recent een resultaat is maar dat ligt anders als je naar wetenschappelijke literatuur zoekt.

Plus, in Scholar is slechts een klein percentage fulltext beschikbaar. Bij zoeken naar wetenschappelijke literatuur gaat het, behalve een goede zoekactie kunnen uitvoeren en kennis hebben van de bron waarin je zoekt, vooral om het daadwerkelijk toegang hebben tot die gevonden informatie. Hoewel er steeds vaker open access gepubliceerd wordt is het overgrote deel van de wetenschappelijke artikelen opgenomen in – zeer dure – databanken waar je niet zo maar bij komt. Ook niet via Google Scholar.

Stel hem in en verken de mogelijkheden voordat je begint
Ook al doet Google zijn uiterste best om een eenvoudige zoekinterface te presenteren in Scholar, bedenk dat het juist bij wetenschappelijke bronnen erg loont – essentieel zelfs is – om te kijken naar de functionaliteiten en de inhoud van zo’n bron. Wat kun je er mee, wat kun je er in vinden en zijn er instellingen waarmee je bepaalde functies op maat kunt maken voor jezelf?

Ik ben zelf geen onderzoeker maar een beetje systematisch bronnen verkennen zodat ik een ander kan uitleggen hoe ze er in kunnen zoeken, dat kan ik wel. Hieronder staan de dingen die ik tegenkwam bij Google Scholar:

Deel 1. Instellingen
Helemaal rechtsbovenaan, bij elke Google dienst, vind je de instellingen. Serieus, ga daar naar toe voordat je ook maar 1 ding tikt in Scholar. Wellicht ten overvloede maar je krijgt dat menu vanzelfsprekend alleen als je ingelogd bent met een Google account in Scholar.

google scholar

Daar vind je drie opties in het linkermenu die alle drie belangrijk zijn. Standaard opent het scherm met de Zoekresultaten opties en kun je daar het aantal resultaten per pagina aanpassen en of er een nieuw venster wordt geopend als je een zoekresultaat aanklikt. Bibliografiebeheer is nog interessanter want de default waarde is dat er geen links voor het importeren van citaten wordt weergegeven bij de individuele zoekresultaten. Juist als je literatuuronderzoek doet zul je die citaatgegevens wel willen hebben en bij voorkeur meteen in het formaat van de software die je daarvoor gebruikt. Met EndNote of Refworks heb je twee van de grootste te pakken en ook al gebruik je een ander pakket, het zal compatibel zijn met 1 of beide formaten.

google scholar

Bij Talen kun je zowel de taal van de menu’s en interface aanpassen (standaard in het Nederlands waarschijnlijk) maar ook de taal aangeven voor de zoekresultaten. Ook dit kan standaard op Nederlands staan terwijl je al snel de eerste optie zult willen kiezen. Mocht je perse alleen maar Franstalige of Spaanse zoekresultaten willen hebben, dan is dit ook de plek om dat in te stellen.

google scholar

De derde optie, Bibliotheeklinks, heeft te maken met die toegang tot wetenschappelijke bronnen. Standaard staat daar alleen Worldcat – als publiek toegankelijke catalogus – maar je kunt daar nog maximaal vier bibliotheken aan toevoegen. Dit moeten bibliotheken zijn die ‘bekend’ zijn bij Google omdat ze een zogenaamde linkresolver gebruiken. Het gaat te ver om dat hier ook toe te lichten maar in essentie verwijst een linkresolver vanuit een zoekresultaat in (dit voorbeeld) Scholar naar de volledige tekst in 1 of meerdere bronnen waar die bibliotheek een licentie op heeft.

google scholar

Heb je dus toegang tot 1 of meerdere onderwijs- of onderzoeksbibliotheken, dan kun je dat hier invullen. In de zoekresultaten zal dan – waar van toepassing – een verwijzing komen naar de betreffende bibliotheek zodat je via die toegang ook daadwerkelijk bij het volledige artikel of rapport kunt komen.

Deel 2. Verken de inhoud
Ook al zijn de Statistieken eigenlijk bedoeld om voor auteurs inzichtelijk te maken welke tijdschriften het meest invloedrijk zijn, je krijgt als zoeker ook een prima beeld van wat er in een taal- en vakgebied (toonaangevend) gepubliceerd is.

google scholar

Bij de Statistieken krijg je links de taal te zien – en alleen bij Engels ook vakgebieden en de subvakgebieden – terwijl rechts de tijdschriften te zien zijn waarnaar het vaakst gerefereerd wordt in citaten. Klik je door op de h5-index waarde van dat tijdschrift dan krijg je de meest geciteerde artikelen uit dat tijdschrift te zien. Dit kan handig zijn om je eigen zoektermen (goed) te formuleren maar ook om je eventueel door te verwijzen naar een andere databank waar 1 of meerdere tijdschriften fulltext te vinden zijn die zeer relevant blijken te zijn voor jou.

Deel 3. Stel je zoekvraag
Natuurlijk kun je op de beginpagina van Google Scholar meteen wat zoektermen invullen en op de blauwe zoekknop drukken maar met de geavanceerde zoekopties stel je eigenlijk automatisch al een (betere) zoekvraag samen waarmee je in ieder geval duidelijk formuleert waar je naar zoekt. En nee, dat is niet zo vanzelfsprekend als je zou denken.

Die zoekopties zitten in Scholar verborgen onder het mini pijltje aan het einde van de zoekbalk.

google scholar

Je krijgt dan het volgende zoekscherm:

google scholar

De eerste vier velden kun je gebruiken om beter op woorden te zoeken (met Boleaanse AND, zinsdeel, OR en NOT). In het enige pulldown menuutje hier kun je aangeven of de gezochte woorden overal in het artikel mogen voorkomen (fulltext en samenvatting) of dat ze perse in de titel moeten staan. Dat laatste zal veel minder zoekresultaten opleveren maar wat je vindt zal waarschijnlijk relevanter zijn.

Vooraf de gevonden zoekresultaten beperken op de auteur kan ook een goede manier zijn om specifieke literatuur te vinden en datzelfde geldt als je al weet in welk tijdschrift het gepubliceerd is. Als laatste kun je ook een gebied van jaartallen aangeven waarin het gevonden resultaat gepubliceerd moet zijn. In het eerste vakje 2010 invullen en het tweede leeg laten levert bijvoorbeeld alleen maar resultaten op van 2010 en recenter.

Deel 4. Doe meer met de zoekresultaten
Heb je een goede zoekvraag geformuleerd waar je ook nog goede resultaten mee gevonden hebt? Maak er dan meteen een alert van zodat je op de hoogte gehouden wordt van nieuwe zoekresultaten in Scholar.

Bij de zoekresultaten staat daarvoor, onderaan in het linkermenu, de optie Melding maken.

google scholar

Als je daar op klikt krijg je de zoekopdracht te zien waarvoor het alert wordt aangemaakt en wordt standaard het mailadres ingevuld dat bij je Google account hoort. Je kunt nog kiezen tussen maximaal 10 of 20 resultaten en verder rest je weinig meer dan op Melding maken te klikken.

google scholar

In het menu kun je bij Meldingen altijd controleren welke alerts je hebt aangemaakt en ze eventueel annuleren.

google scholar

Zolang je maar beseft dat Google Scholar niet de totaaloplossing is voor het zoeken naar wetenschappelijke literatuur kan het een hele nuttige bron zijn om in te zoeken. Bedenk wel dat het lang niet alles bevat – helemaal al niet fulltext – en dat je waarschijnlijk nog steeds in vakspecifieke wetenschappelijke bronnen moet zoeken om meer te vinden over specifieke onderwerpen. Scholar kan wel uitstekend als eerste ingang dienen om bijvoorbeeld die bronnen te identificeren.

#

Wayback Machine: nog eens kijken naar websites en content van vroeger

wayback machineTerug kunnen zoeken naar tweets die je jaren geleden verstuurd hebt kan een handige functionaliteit zijn maar het is vooral confronterend interessant om terug te zien hoe je vroeger twitterde, met wie je twitterde en waarover je twitterde. Een blik op het verleden als het ware waarmee je vaak dingen herontdekt waarvan je dacht dat je ze nooit zou vergeten (en toch vergat).

Nou is het fenomeen tweets nog een redelijk recent iets natuurlijk. Wat als je op zoek bent naar teksten die je voor je websites of blog geschreven hebt? Vijf jaar geleden. Of tien jaar geleden. Misschien heb je zelf nog backups gemaakt of heb je nu nog dezelfde site of blog als toen. Maar wat als je nog eens een blik wilt werpen op je oude blog uit 2002 die je al lang verwijderd hebt en waarvan de domeinnaam al lang niet meer in je bezit is? Wat als je op zoek bent naar die site die je in 2008 als bibliotheek had en die je moest opdoeken omdat je naar een nieuwe intranetsite overstapte?

Wayback Machine
The Internet Archive is een organisatie en webdienst die websites archiveert in de vorm van snapshots. Ze streven ernaar om alle websites op het internet volledig te archiveren door met enige regelmaat alle webpagina’s te kopieren naar hun archief inclusief scripts, afbeeldingen enz. De Wayback Machine is een zoekmachine waarmee vervolgens door de huidige 240 miljard webpagina’s (vanaf 1996 tot enkele maanden geleden) gebladerd kan worden aan de hand van de (toenmalige) URL.

En dat is pas echt een blik op het verleden!

wayback machine

Vul de URL in van de site die je zoekt en de Wayback Machine toont hoeveel captures ze hebben van de site die op de URL in kwestie te vinden was/is. Je kunt terugbladeren naar hoe die site er uit zag op een specifieke datum waarop zo’n archiefexemplaar aangemaakt is en zelfs doorklikken op de linkjes en menu-opties die indertijd aanwezig waren.

Roeien met de riemen
Een perfecte weergave levert dat maar zelden op. Lang niet alle bestanden die door de webpagina’s gebruikt worden, of waar naar wordt verwezen met linkjes, zijn aanwezig. Eenvoudige websites die (handmatig) in HTML gemaakt zijn werken het beste en sites (en dus ook veel blogs) die een CMS gebruiken het slechtste. Logischerwijs stikt het natuurlijk van de gebroken links en ook de afbeeldingen op pagina’s zelf worden niet altijd getoond.

Maar zelf vind ik het nog steeds een feest om die oude sites terug te zien.

Zoals mijn website uit 2002 waar ik op blogde, ook al hield ik de site bij in Dreamweaver in gewoon HTML. Mooie herinneringen maar ook gruwelen van mijn blogstijl. Waarom schreef ik in godsnaam over mezelf in de derde persoon?

En de website van de nieuwsgroep nl.kunst.sf+fantasy waar ik behalve lijsten met reviews ook mijn enige fan fiction verhalen had staan.

Maar dus ook de door mij gezochte website – door een oudcollega eveneens in HTML gemaakt – van de hogeschoolbibliotheek waar ik werk. Even terugkijken naar hoe het in 2008 ook al weer was.

wayback machine

De Wayback Machine is een prachtige webdienst die precies doet wat de naam zegt: het brengt je terug naar het internet van het verleden en je content van toen. Als dat geen mooie manier is om een avondje achter je pc door te brengen?

#

Alerts maken met Talkwalker Alerts

Na mezelf jaren (kennelijk) blind gestaard te hebben op Google Alerts blijken er nog veel meer van dat soort diensten te zijn die je attenderen op nieuwe zoekresultaten aan de hand van eigen zoektermen. Een paar dagen geleden kwam ik Mention al tegen maar hoewel de gratis versie prima voldeed was ik toch benieuwd of er andere alternatieven te vinden waren.

talkwalker alerts

Talkwalker Alerts is zo’n alternatief. Ze presenteren zich als het beste gratis en makkelijkste alternatief voor Google Alerts en het is duidelijk dat ze heel goed gekeken hebben naar de vormgeving van hun concurrent. Het scherm waarin je een nieuwe alert aanmaakt lijkt meer dan oppervlakkig op dat van Google Alerts. Behalve je zoektermen/zoekactie hoef je slechts nog het soort resultaten, taal, frequentie en een filter(tje) te kiezen uit een pulldown menu. Precies zoals bij Google Alerts.

Met Talkwalker Alerts doorzoek je eveneens de Google zoekresultaten en dat betekent dat je bij je zoekactie behalve losse zoektermen gebruik kunt maken van alle zoekoperatoren die je ook in de Google zoekmachine tot je beschikking hebt. Een handige Preview optie geeft je een voorproefje van de zoekresultaten die het ingevulde formuliertje oplevert. Hiermee kun je de zoekactie en opties eventueel aanpassen – en kijken wat het verschil is –  voordat je de alert definitief aanmaakt.

talkwalker alerts

Nadat je een alert hebt aangemaakt krijg je op het mailadres dat je opgegeven hebt een wachtwoord binnen waarmee je (al je) alerts kunt beheren en aanpassen. Ook dit beheerscherm blinkt uit door eenvoud maar biedt wel verrassend veel opties. Net zoals bij Google kun je overschakelen naar alleen emails met tekst en je aangemaakte alerts exporteren naar een CSV bestand maar bij Talkwalker kun je ook de emails van individuele alerts uitzetten.

Die optie zit er bij omdat, daar waar Google bezig lijkt alles wat met RSS te maken heeft uit hun diensten te schrappen, er ook een RSS feed voor elk alert aanwezig is. In plaats van periodiek mailtjes te krijgen kun je dus ook ervoor kiezen om – met de link onder het RSS icoontje – je te abonneren op de feed.

Of Google in de toekomst Alerts gaat schrappen weet ik natuurlijk niet. Talkwalker Alerts is nu al effectief een kloon van Google Alerts maar dan wel eentje waar de makers nog steeds regelmatig verbeteringen in aanbrengen. Alleen al de mogelijkheid van een RSS feed voor een alert maakt Talkwalker Alerts de moeite van het uitproberen waard. Ik heb nu in ieder geval mijn alerts bij Google Alerts weggehaald en in Talkwalker Alerts gezet.

En mezelf geabonneerd op de RSS feeds. In Google Reader voor zo lang dat nog kan.

#

Alerts maken met Mention: omdat je nu eenmaal niet alles zelf kunt bijhouden op het web

Als je net zoals ik gebruik maakt van RSS feeds en (Google) alerts om nog een beetje overzicht te krijgen (houden) op alle interessante nieuwtjes die dagelijks op het web verschijnen, dan weet je ook dat het steeds lastiger wordt met die twee tools. Google trekt de stekker uit Google Reader – en het is nog maar afwachten wat ze met Feedburner gaan doen – en hoewel dat RSS feeds niet meteen de nek omdraait, helpt het ook zeker niet.

Een andere dienst van Google, Google Alerts, heeft dan wel niets met RSS te maken maar het geeft je de mogelijkheid om aan de hand van willekeurige zoektermen op de hoogte gehouden te worden van (alle) nieuwe sites en bronnen die door Google geïndexeerd worden. Je krijgt een mailtje met updates van nieuwe Google zoekresultaten op basis van je zoekopdrachten. Heel handig om een specifieke ontwikkeling in het nieuws te volgen of om te kijken of je zelf nog ergens genoemd wordt op internet ;)

Nou zou het alleen wel een stuk handiger zijn als dat ook echt goed zou werken. En met Google Alerts kun je daar wel aan twijfelen. De laatste maanden werkt het zelfs zo wisselvallig en slecht dat gebruikers nattigheid beginnen te voelen. Zal Google Alerts één van de volgende diensten zijn van Google die het loodje legt? Tijd om naar een alternatief om te kijken?

Mention
Eén van die alternatieven is Mention. In tegenstelling tot Google Alerts is dit zowel via het web te gebruiken als met Windows/Mac/Linux en zelfs iOS en Android applicaties. De essentie is echter net zo eenvoudig: je voert termen in, vinkt de gewenste taal aan en je wordt in de (web)applicaties en via email op de hoogte gehouden van al het nieuws waar die termen in voorkomen.

mention

Je kunt eventueel nog wat verfijningen aanbrengen in de zoekresultaten die je van Mention terugkrijgt als je een alert aanmaakt. Je kunt specifieke bronnen afvinken, eventuele sites die je perse niet meegenomen wilt hebben toevoegen en twee opties afvinken die Mention gebruikt om je resultaten zo relevant mogelijk te maken. Ik zou ze eigenlijk altijd aangevinkt laten maar je kunt er natuurlijk mee experimenteren.

mention

Vanaf dat moment is je alert aangemaakt en krijg je meteen de resultaten te zien. Voor mijn test ziet dat er dan zo uit waarbij ik een alert heb op mijn eigen naam (egosearching blijft leuk) en eentje op Vakblog.

mention

Als je je Twitter en/of Facebook account koppelt aan Mention krijg je zelfs realtime updates binnen op je zoektermen en 1x per dag ontvang je een mail met alle nieuwe mentions. Voordat je helemaal los gaat op alle mogelijkheden is het zaak te beseffen dat het geen volledig gratis dienst is. De gratis variant stelt je in staat om maximaal drie alerts aan te maken die per maand maximaal 500 mentions mogen/zullen genereren. Voor privegebruik zal dat al snel voldoende zijn en je kunt je zoektermen aanpassen in je alerts (specifieker maken) om het aantal mentions lager te krijgen. De eerste maand heb je automatisch een proefversie voor de betaalde variant maar die is vanzelfsprekend uitgebreider. Je verliest na die maand dus wel die extra functionaliteiten als je het bij de gratis versie houdt.

De betaalde versie kost meteen 20 dollar per maand maar geeft je een onbeperkt aantal alerts en maximaal 50.000 mentions elke maand. Het zal vooral handig zijn als je je (intensief) met merken of marketing bezig houdt. Ook voor statistieken en de mogelijkheid om gevonden data te exporteren voor verdere bewerking moet je helaas (maar logisch) de betaalde variant hebben. Wil je er echt een beetje professioneel mee werken dan is het duidelijk dat je daar 20 dollar per maand voor mag betalen.

Mention is echter ook als gratis versie nog steeds een handige tool en een prima alternatief voor Google Alerts. Met als grootste voordeel dat Google tenminste Mention niet uit de lucht kan halen ;)

#

Google laat Flight Search (Vluchten) opstijgen in Nederland. Nu wachten tot het opgedoekt wordt

Google Flight Search

Google schrapt en Google begint weer met wat nieuws. Google Flight Search om precies te zijn of Google Vluchten als je browser – net als bij mij – weigert om de Engels versie te selecteren. Google Flight Search is niet helemaal nieuw want deze zoekmachine bestond al een kleine anderhalf jaar voor de Amerikaanse maatschappijen. Vanaf vandaag is deze echter ook in Nederland, Engeland, Frankrijk, Italië en Spanje beschikbaar.

Nu kun je zoeken op een eindbestemming, routes en prijzen van verschillende luchtvaartmaatschappijen vergelijken en natuurlijk die goedkope vliegtickets rechtstreeks boeken. Het is al weer 10 jaar geleden sinds ik in een vliegtuig gezeten heb dus ik zal er zelf niet snel gebruik van maken maar Google Flight Search gaat in de bookmarks voor het geval dat.

Vliegtickets.nl, cheaptickets.nl en al die andere vergelijkingssites zullen er minder blij mee zijn dat Google de Nederlandse vliegticketmarkt bestormt maar ach, die kunnen in elk geval gaan hopen dat Google volgend jaar deze dienst weer opheft als er niet genoeg gebruik van gemaakt wordt ;)

#

Actueel houden en publiceren van je twitter archief met Google Drive

twitterarchief_googledrive

Natuurlijk is het handig dat je eindelijk je eigen twitter archief kunt downloaden. In het stappenplan ging ik ook uitgebreid in op hoe je deze tweets netjes in Excel kunt zetten met alleen maar een korte verwijzing naar de mogelijkheid om je ‘twitter archief website’ te uploaden naar je eigen server.

Beschik je echter niet over een stukje ruimte bij een webhost omdat je bijvoorbeeld blogt bij Blogger of WordPress.com, dan kun je heel gemakkelijk je twitter archief laten hosten / publiceren bij Google Drive. Iedereen met een Google account – en wie heeft die tegenwoordig niet – heeft 5 GB ruimte voor zijn documenten maar het is ook mogelijk om daar een kleine en eenvoudige website neer te zetten.

Uploaden en publiceren van je twitter archief bij Google Drive

  1. Allereerst pak je het tweets.zip bestand uit naar een nieuwe map ergens op je harde schijf. Noem het tweets of twitterarchief, het maakt niet veel uit;
  2. Ga naar Google Drive (log in indien nodig) en klik links bovenaan op de upload knop die naast de Create knop staat. Kies daar voor Folder om zometeen de hele map te gaan uploaden die je net aangemaakt hebt op je harde schijf;
  3. Blader naar die map waarin je uitgepakte twitter archief zit en klik op OK. Je krijgt nu een schermpje met Upload settings die de gelegenheid geeft om bestanden te converteren naar een formaat van Google Drive zelf. Maak hier geen gebruik van want anders gaat het fout! Zorg dat tenminste de eerste twee vakjes NIET aangevinkt staan;
  4. Klik op Start upload en wacht tot alle bestanden geupload zijn in je Google Drive. Klik vervolgens in het uploadvenster op het linkje Share om de instellingen te veranderen van de map met je twitter archief;
  5. In de Sharing Settings zie je dat, zoals Google Drive dat standaard doet, de map op Private staat. Wil je dat het twitter archief als website te bekijken is dan moet de map gedeeld worden. Klik op Change en kies vervolgens voor Public on the web om de map en inhoud te delen met de hele wereld. Standaard kunnen mensen alleen de bestanden bekijken en niet bewerken. Precies wat je hier wilt;
  6. Omdat het om een website gaat die gepubliceerd wordt moet je de URL die je wilt gebruiken en delen aanpassen. In de URL moet je het begin (https://docs.google.com/folder/d) vervangen door https://googledrive.com/host/. Bij mij werd https://docs.google.com/folder/d/0B3DGELKQg4PeSjNmSWxYWTZrXzQ daarmee https://googledrive.com/host/0B3DGELKQg4PeSjNmSWxYWTZrXzQ

En dat was het. Nu staat je gedownloade twitter archief online bij Google Drive en kun je overal ter wereld je tweets terugzoeken.

Tenminste, tot de datum en het tijdstip dat je het twitter archief hebt aangevraagd. Alle tweets die je daarna hebt verstuurd zitten natuurlijk niet in dat archief. Gelukkig heeft dezelfde persoon die eerder al een handige Google Spreadsheet maakte om tweets te archiveren, nu een Spreadsheet gemaakt om je twitter archief bij Google Drive bij te werken met je recente tweets.

Bijwerken van je twitter archief op Google Drive

  1. Allereerst open je de Google Spreadsheet Update/Host Twitter Archive on Google Drive en maak je een kopie naar je eigen Google Drive account door onder File te kiezen voor Make a copy;
  2. Volg de instructies die in de Spreadsheet staan. Als je al het bovenstaande gedaan hebt, dan kun je de eerste twee overslaan. Klik op de Click Authorize/Add Sync Menu knop om te autoriseren dat de Spreadsheet scripts mag uitvoeren en dan nog een keer om een nieuwe menu item te krijgen: Sync Twitter Setup;
  3. In dat nieuwe menu Sync Twitter Setup ga je vervolgens de menu items in volgorde af. In de eerste, Set Archive Path, moet het ID ingevuld worden van de map waarin je twitter archief staat. Dat zijn de 28 cijfers en letters die je in de URL hebt staan uit het stappenplan hierboven;
  4. De tweede in dat menu is API Authentication en hier wordt het ingewikkelder. Hier moet je je twitter archief registreren als applicatie bij Twitter zodat de spreadsheet nieuwe tweets mag ophalen. Je krijgt specifieke instructies als je API Authentication aanklikt en lees deze goed! Na de registratie bij Twitter krijg je een aantal codes (keys) waarvan je de eerste twee moet invullen in het schermpje in de Spreadsheet.
  5. Na deze stap moet het script authorize gedraaid worden in de spreadsheet (je wordt er naar verwezen in de instructies) om de nieuwe ‘applicatie’ toegang te geven tot je Twitter account. Ga hierbij naar het menu Scripts, kies voor authorize en klik dan op Run. Je weet dat het goed gegaan is als je het bekende scherm op twitter.com krijgt waarin je gevraagd wordt of je de applicatie toegang wilt geven tot je account;
  6. Alles gelukt? Dan kun je de derde optie in het Sync Twitter Setup gebruiken, Update Archive Now, om alle tweets die nieuw zijn in je twitter archief te downloaden en te integreren in je archief! Met de laatste optie Turn Auto-Refresh On kun je dit zelfs automatisch laten doen in de toekomst zonder dat je de Spreadsheet hoeft te openen. Eén keer per dag worden dan alle nieuwe tweets opgehaald.

De maker van de Google Spreadsheet, Martin Hawksey, heeft ook nog een korte video op YouTube gezet waarin de bovenstaande stappen (grotendeels) voorbij komen.

Nu staat je twitter archief netjes bijgewerkt online, gehost door Google Drive. Zonder dat je er verder naar hoeft om te kijken. Het enige dat je nog rest is om de link naar je twitter archief met de wereld te delen. Of niet natuurlijk.

#

Downloaden en inzien van je eigen twitter archief: een stappenplan

Deze blogpost over het downloaden en inzien van je eigen twitter archief verscheen oorspronkelijk op blogpraat.com. Omdat het ook in het verlengde ligt van mijn andere blogposts op Vakblog, plaats ik hem alsnog ook hier.

Inleiding

Eind vorig jaar kondigde Twitter aan de persoonlijke archieven met de eigen tweets ter beschikking te gaan stellen aan iedere twitteraar. Erg handig en leuk om je eigen oude tweets er op na te kunnen slaan. Met de zoekfunctie van Twitter zelf kun je namelijk maar nauwelijks oude tweets vinden. Voornamelijk tweets van maximaal een week oud hoewel Twitter nu bezig is om ook – zeer beperkt – oudere tweets terugvindbaar te maken. Een eigen archief van alle tweets die je ooit verstuurd hebt, dat zou ideaal zijn om bijvoorbeeld eens na te kijken wanneer je voor het eerst een tweet met de #blogpraat hashtag de wereld in hebt gestuurd.

Request your archive

De mogelijkheid om je eigen twitter archief te downloaden wordt (heel) geleidelijk uitgerold. Voor de Nederlandse twitteraars is die mogelijkheid nog niet beschikbaar maar kun je er wel van gebruik maken als je de taal van je Twitter profiel op twitter.com (tijdelijk) op Engels zet. Als je dat doet verschijnt er bij de instellingen (die dan dus settings heten) onderaan een nieuwe knop ‘Request your archive’ om een downloadlink aan te vragen voor je eigen persoonlijke twitter archief.

twitterarchief0

Klik deze knop aan en enkele minuten later krijg je een mailtje op je mailadres dat je opgegeven hebt in je Twitter profiel. In dat mailtje zit een downloadlink en daarmee download je een tweets.zip bestand met daarin al je tweets!

Wat zit er in je archief?

Als je dat archief uitpakt (met behulp van de ingebouwde uitpakfunctie van Windows of een gratis programma als 7-Zip) dan zitten daar honderden bestanden in, afhankelijk van hoe lang je al twittert, in vele mapjes. Al je tweets zijn per maand in Javascript formaat opgenomen in dat archief maar zitten daarnaast ook in 1 handig CSV bestand die je in Excel kan openen en inzien. Hieronder leg ik uit hoe je je tweets zowel als een losse website en via Excel kunt inzien en doorzoeken.

Je eigen kant en klare website

Je uitgepakte archief kun je meteen openen, inzien en doorzoeken door simpelweg te dubbelklikken op het index.html bestandje dat in je archief zat. Dat opent meteen een website in je standaardbrowser waarin je al je tweets gelijk ziet! Aan de rechterkant kun je klikken op het jaar en de balkjes geven de maanden binnen dat jaar aan. Als je daar op klikt zie je alle tweets van die maand. Bovenin zit een zoekbalkje en je raadt het vast al, daar kun je al je tweets in 1 keer mee doorzoeken. Tijd om te zoeken op #blogpraat om al je blogpraat tweets terug te lezen!

twitterarchief2

Deze website staat dus nu op je pc in de map waar je het archief hebt uitgepakt. Deze kun je vervolgens ook op andere plekken neerzetten zodat je ook je archief kunt bekijken en doorzoeken als je niet achter je pc zit.  Bijvoorbeeld:

  • door alle bestanden (en mappen) met FTP te uploaden naar een mapje op je website. Handig als je je eigen domein en webhost hebt. De mijne staat in een mapje ‘tweettweet’ waardoor ik er altijd bij kan.
  • door alle bestanden (en mappen) in je Dropbox, Skydrive of Google Drive account neer te zetten.
  • door alles op een USB stick te zetten die je altijd bij je hebt. Altijd je tweets op zak ;)

Hoewel de kant en klare website de handigste optie is om je tweets te doorzoeken, zie je helaas alleen maar de meest basale gegevens bij de tweets. Zo zie je niet op wie je gereageerd hebt en ook niet met welke twitter client je de tweet geplaatst hebt. Deze gegevens zitten wel in dat CSV bestand dat je in Excel kunt openen. Je kunt dus ook al je tweets in 1 Excelbestand zetten!

Je tweets in Excel

Hoewel je kunt dubbelklikken op een CSV bestand om deze meteen in Excel te openen, levert je dat wel een slecht leesbaar bestand op. Een CSV bestand is namelijk een speciaal tekstbestand waarin alle gegevens met komma’s van elkaar gescheiden zijn. Je ziet dan al die komma’s en aanhalingstekens in Excel terug en dat leest/werkt niet zo fijn natuurlijk. Hieronder laat ik de stappen zien waarmee je een goed Excel bestand krijgt met al je tweets erin! Ik gebruik hiervoor een Engelstalige versie van Excel 2010 maar het zou in alle versies van Excel hetzelfde moeten werken.

Stap 1. Open een leeg document in Excel en klik op het tabblad Data. Vervolgens kies je voor From Text om het CSV bestand te importeren in Excel.

twitterarchief_excel1

Blader naar de map waar het tweets.csv bestand staat en druk op OK. Vervolgens start de import wizard die je in verschillende stappen door het proces van importeren loodst.

Stap 2. Kies bij de eerste stap van de wizard voor Delimited (of gescheiden). Dit wil zeggen dat er een scheidingsteken zit tussen de verschillende velden in het csv bestand.

twitterarchief_excel2

Stap 3. De tekstwizard denkt waarschijnlijk dat het scheidingsteken een spatie is maar dat is niet zo. Het is een komma dus deze moet je in stap 2 van de wizard aanvinken! Vink andere opties af als ze aanstaan. Je ziet ook onderin dat venster dat er ineens lijntjes netjes verschijnen tussen de verschillende velden.

twitterarchief_excel3

Stap 4. Je kunt op Next klikken om nog meer in te stellen maar dat is in dit geval overbodig. Klik op Finish om de wizard af te sluiten en je krijgt de vraag of je de inhoud in het geopende lege Excel document wilt of in een nieuwe worksheet.

twitterarchief_excel4

De bestaande is prima dus druk op OK en je ziet alle ingevulde velden verschijnen in je Exceldocument. Helaas worden alle Twitter id’s – alle getallen die in de eerste vijf kolommen staan – niet goed herkend als getallen. Je krijgt ze in een wiskundige weergave te zien (met E erin) en dat leest niet handig. Gelukkig is dit ook snel aan te passen.

Stap 5. Selecteer – door shift ingedrukt te houden en dan op de kolom letters A, B,C, D en E te klikken – alle kolommen waarin Twitter id’s staan. Rechtsklik dan op 1 van de kolommen en kies in dat menu voor Format Cells.

twitterarchief_excel5

Stap 6. Kies in het volgende menuutje links voor Number (Getal) om de Twitter id’s als gewone getallen weer te geven. In het rechterdeel kun je instellen hoeveel getallen er achter de komma getoond moeten worden. Het zijn allemaal hele getallen dus zet dit naar 0!

twitterarchief_excel6

Druk op OK en je bent klaar. Alles staat nu goed weergegeven in het Excel bestand en je kunt filteren, sorteren, zoeken en lijstjes maken binnen het bestand met al je tweets. Daar heb je vanzelfsprekend wel wat basiskennis Excel voor nodig :)

#

Downloaden van je eigen Twitter archief

Eind vorig jaar kondigde Twitter aan de persoonlijke archieven met de eigen tweets ter beschikking te gaan stellen aan iedere twitteraar. Een mooi initiatief vond ik dat. Niet alleen leuk om terug te bladeren en te kijken waar mijn eerste tweets over gingen maar ook een nuttig middel als je, zoals ik, Twitter gebruikt om linkjes en informatie te delen die je later zelf ook nog wilt kunnen terugvinden. Begin 2011 installeerde ik Tweet Nest om vanaf dat moment alle tweets die ik zelf verstuurde te archiveren maar door de beperking van Twitter zelf kon ik toen maar 3200 tweets opduikelen. Ik miste er nog enkele duizenden die voor september 2010 door mij getwitterd waren. Die hoopte ik in ieder geval nu wel terug te krijgen met het archief van Twitter zelf.

Ik moest wel geduld hebben want de mogelijkheid om je eigen tweets te downloaden werd geleidelijk uitgerold. Met enige regelmaat keek ik bij de instellingen van (web) Twitter of ik er al bij kon maar helaas, begin januari was dat nog steeds niet het geval.

twitterarchief0Sinds vandaag zag ik echter ineens bij de instellingen de mogelijkheid staan om je archief op te vragen. Enkele minuten later kreeg ik een mailtje met een downloadlink en weer even later had ik een zipbestandje van bijna 10MB groot op de harde schijf staan. Als je dat zipbestandje uitpakt krijg je je tweets per maand in een mappenstructuur in javascript formaat in combinatie met een index.html bestand waarmee je je archief per maand kunt doorbladeren. Een losse site zeg maar.

twitterarchief2

Je archief website
Als je het index.html opent in je browser dan kun je dus per jaar en per maand daarbinnen bladeren door al je tweets. Er zit een kleine zoekfunctionaliteit ingebouwd waarmee je je tweets op trefwoorden kunt doorzoeken. Dit werkt bijzonder goed en mijn 47.000 tweets zijn er binnen seconden mee te doorzoeken.

Je krijgt echter niet heel veel meer te zien dan de tekst van je tweets zelf. Elke tweet heeft een linkje waarbij je de tweet op twitter.com kunt bekijken en een mogelijkheid om er (alsnog) op te reageren en de tweet favoriet te maken. In Tweet Nest zie ik van mijn tweets ook of het een reply is op een andere tweet inclusief vermelding van wie die tweet oorspronkelijk stuurde. Bij mijn tweets staat vervolgens ook nog vermeld met welke Twitter cliënt ik die verstuurd heb. Het is erg aardig om te zien hoeveel verschillende ik de afgelopen 5,5 jaar gebruikt heb.

In het door Twitter aangeleverde zipbestand blijkt ook een csv bestand te zitten waar eveneens al je tweets in zitten. Deze bevat uitgebreidere informatie dan de javascript versies en hierin zie je dus wel de ontbrekende gegevens staan, inclusief reply en cliënt gegevens. Dat csv bestand kun je in Excel openen en hiermee doorzoeken maar ik hoop dat het wellicht ook te importeren is in Tweet Nest. Op die manier heb ik daar mijn volledige archief beschikbaar. Eentje is wel genoeg.

Favorieten
Een goede reden om Tweet Nest te behouden is dat deze ook alle tweets archiveert die ik favoriet gemaakt heb. Ik gebruik die functie heel veel aangezien ik op die manier linkjes en nuttige informatie van anderen later kan terugvinden. Zowel via de webversie van Twitter en Tweet Nest maar ook omdat ik alle favoriete tweets door laat sturen naar Evernote via IFTTT.com.

In je persoonlijk twitter archief ontbreken je favorieten helaas (ook in het csv bestand). Jammer want ik kan me voorstellen dat juist deze interessant zijn om terug te bekijken en vinden in combinatie met je andere tweets. Favorieten worden gelukkig wel (goed) bewaard via de webversie van Twitter op je profielpagina dus je kunt ze nog wel nalezen.

Met nog een verzoekje
Hoewel de toegang tot je eigen twitter archief een mooi begin is, zou het wel heel aardig zijn als er nog wat meer gegevens beschikbaar kwamen. De ontwikkelingen in volgers en de twitteraars die jij volgt bijvoorbeeld. Erg aardig om terug te kunnen halen wanneer je een specifiek iemand bent gaan volgen (of die jou). Ook de ontwikkelingen in de aantallen volgers en gevolgden zouden handig zijn, net als meer gegevens over de replies.

Tweets hebben (meestal) context. Je reageert op iemands tweet en anderen reageren weer op die van jou. Twitter houdt bij hoe de conversaties verlopen maar deze tweets – van anderen- staan niet tot je beschikking. Je ziet alleen jouw tweets en jouw aandeel in die conversatie. Dat kan en moet toch beter kunnen, Twitter?

Het begin is er echter!

Op het moment van schrijven lijkt de mogelijkheid om je archief op te vragen beperkt te zijn tot Engelstalige twitterprofielen. Ik heb mijn twitterprofiel standaard in het Engels staan maar heb bevestigd gekregen van Nederlandstalige twitteraars dat de optie ook bij hun instellingen verschijnt als je de taal tijdelijk naar Engels zet.

#

tweetbirdonthewall

De zoekfunctie van Twitter vindt nu ook oudere tweets (maar lang niet allemaal)

Twitter zoekactieDe extreem beperkte zoekfunctie van Twitter – je kunt slechts 1 week aan tweets doorzoeken – was eerder al aanleiding om zelf op zoek te gaan naar een manier om tweets te archiveren. Twitter maakt het eindelijk mogelijk dat mensen hun eigen archief van tweets kunnen downloaden (ook al wacht ik nog steeds op die functionaliteit in mijn instellingen) maar daar heb je weinig aan als je tweets van anderen wilt vinden die ouder zijn dan een week.

Ook al zat het er volgens de CEO van Twitter niet in dat de zoekfunctie ooit nog wordt uitgebreid om alle openbare tweets van alle twitteraars te kunnen doorzoeken, gisteren maakte Twitter bekend op haar blog dat je nu ook oudere tweets zult aantreffen in je zoekresultaten.

Dat zal echter een kleine selectie zijn van de miljarden tweets volgens Twitter. Alleen relevante oudere tweets zullen getoond worden waarbij die relevantie wordt beïnvloedt door de mate van interactie. Of (en hoe vaak) er doorgeklikt is op een tweet, of (en hoe vaak) die als favoriet is gemarkeerd en eventueel geretweet is.

[...] the Tweets that you’ll see in search results represent a fairly small percentage of total Tweets ever sent. We look at a variety of types of engagement, like favorites, retweets and clicks, to determine which Tweets to show. We’ll be steadily increasing this percentage over time, and ultimately, aim to surface the best content for your query.

Dat betekent dat mijn verwijderde testtweet uit 2010 nog steeds niet terug te vinden is maar aan de hand van mijn eigen archief (in Tweetnest) kan ik nu zonder problemen tweets van mezelf terugvinden die teruggaan tot 2009. Hoeveel procent van de oudere tweets je daadwerkelijk kunt terugvinden (de recall) is lastig vast te stellen maar als ik nu bij de geavanceerde zoekfunctie ga zoeken op al mijn tweets met de hashtag #blogpraat, dan krijg ik wel een beeld.

Volgens mijn eigen archief zijn dat 2416 tweets geweest sinds oktober 2011. Twitter geeft me 118 van die tweets terug als ik ze zoek en dat is een recall van 4,88%. Nou zal dat percentage flink kunnen variëren als je tweets vaker links bevatten (waar mensen op klikken) of geretweet worden en zegt die 4,88% dus niet heel veel. Naar mate de tweets ouder zijn dan 2011 of 2010 zal de interactie met die tweets echter ook minder worden omdat er simpelweg minder twitteraars waren. Ook al vind je nu tweets ouder dan een week, het percentage dat gevonden kan worden neemt stevig af naarmate je verder terug gaat in de tijd.

Dat wordt ook wel bevestigd als je kijkt naar mijn 118 gevonden tweets. Maar liefst 37 zijn afkomstig van afgelopen maandag en zijn minder dan een week oud. De recall van die dag is 100% trouwens. Van de maandag daarvoor (28 januari) worden er vier getoond en nog slechts twee van 21 januari waarmee het percentage meteen onder de 10% duikt en bijna nooit meer de 2% haalt als je kijkt naar de resultaten uit 2012.

Oftewel, het is een leuke toevoeging dat je nu in Twitter ook tweets van meer dan een week oud kunt terugvinden maar de kans dat je een specifieke oudere tweet terugvindt is behoorlijk klein. Oplossingen om tweets te archiveren blijven daarmee dus onverminderd interessant.

@ foto: id-iom via photopin cc

#

Pagina 1 of 9123...Laatste »
  • 2006- 2013 Vakblog – werken met informatie
    Powered by WordPress // Theme: Tatami by Elmastudio
Top