Vakblog – werken met informatie
 
 
  • Archief
  • Gastbloggers
  • Auteursrechten links
  • Over Raymond

Google (nooit) in … Google uit

26/12/2009 om 9:24 Geplaatst door Raymond Snijders in Metadata, Zoeken

Daar waar hele volksstammen bezig zijn met hun pagerank in Google om vooral maar zo hoog mogelijk in de zoekresultaten te komen van deze zoekgigant, was ik afgelopen week bezig enkele kleine sites en een weblog juist buiten Google te houden. Omgekeerde SEO dus.

Op deze pagina vind je een uitleg hoe je op je eigen site(s) dingen kunt aanpassen die ervoor zorgen dat de inhoud niet meer meegenomen wordt. Ik had in het verleden altijd braaf de robots.txt optie gebruikt om Google buiten de deur te houden maar kwam er dus recent achter dat dan wellicht de inhoud niet geindexeerd wordt maar dat de url zelf gewoon opduikt in de zoekresultaten. Matt Cutts van Google legde dat uit op YouTube, lekker simpel met een marker op een whiteboard:

Kortom, met enkele eenvoudige aanpassingen in de header van de pagina’s (het handigste via een template in te stellen zodat je dat niet op elke pagina afzonderlijk hoeft in te stellen) zorg je ervoor dat Google de inhoud en zelfs de URL negeert van de site. De ironie is wel dat je dus eigenlijk Google de site moet laten indexeren zodat je kunt zeggen dat die niet getoond mag worden. De volgende tag opnemen in de header/template voldoet dan:

<meta name=”robots” content=”noindex,nofollow”/>

Voor 1 site heb ik de .htaccess aangepast in de map op de server door die ene regel toe te voegen:

Header set X-Robots-Tag “noindex, nofollow”

Dat werkte perfect maar een tweede site bij een andere webhost gaf vervolgens een error melding en moest ik alsnog de templates aanpassen van de site zelf.

Boeiend is wel de vraag hoe je nu eigenlijk test of het werkt. Als het namelijk goed werkt zie je er dus nooit wat van terug in Google maar je wilt daar ook niet te laat achterkomen. Om nou de sites aan te melden bij Google gaat me ook wat te ver dus ik heb geloof ik maar eens vertrouwen dat het gewoon werkt zoals het zou moeten werken.

Oh ja, ben je toch te laat geweest en wil of kun je niet wachten tot Google na enkele dagen de index bijgewerkt heeft? Dan kun je, als je zelf eigenaar bent, ook een verzoek indienen om webpagina’s te laten verwijderen. Dit is echter maar voor de periode van 90 dagen waarna Google de site opnieuw zal indexeren, wat je natuurlijk voldoende tijd geeft om de aanpassingen te maken of de pagina(‘s) in kwestie te verwijderen.  Dit is de methode die we in het begin gebruikt hebben om enkele zoekresultaten in Google voor de HBO Kennisbank te laten verwijderen aangezien er toen onverwachts prive gegevens van oud studenten getoond werden.

Tags: Google, htaccess, robots.txt, SEO

Nog geen reacties

Leave a Reply Cancel reply

  • Zoeken

  • Volg mij ook

    • RSS Feed
    • Google+
    • LinkedIn
    • Twitter
  • @rsnijders tweets

    Twitter Logo
    Refresh
    Kijk alle tweets »
  • Recente Reacties

    • Edwin: Over hoe ik zelf blog
    • (@SURFannemiek) (@SURFannemiek): Over publiceren van afstudeerwerken die vertrouwelijke informatie bevatten
    • (@SURFannemiek) (@SURFannemiek): Hergebruik van video’s met een CC licentie
    • Carolien Geurtsen (@Caro_Geurtsen): Over hoe ik zelf blog
    • Roger Schmitz (@RogerMSchmitz): Stroomlijnen van informatie met ifttt
    • SuperHarry: MKV bestanden met ondertiteling converteren naar dvd formaat
    • Marie-Anne (@Marieanne73): Stroomlijnen van informatie met ifttt
    • (@rsnijders) (@rsnijders): Stroomlijnen van informatie met ifttt
    • Marie-Anne (@Marieanne73): De bibliotheek dichtbij in je Google tekstverwerker
    • Raymond Snijders: De bibliotheek dichtbij in je Google tekstverwerker
  • Stats

      691 posts

      1,219 comments

      Updated on 2012-05-21 22:09:43 (GMT )

      Most recent post: Over het maken van backups van je WordPress blog

  • Creative Commons

    Creative Commons Licentie

    Dit werk is gelicenseerd onder een Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 3.0 Nederland licentie

    Dit betekent dat teksten van de blogposts hergebruikt mogen worden zolang het niet-commercieel is, er naamsvermelding bij gedaan wordt en die nieuwe teksten ook zelf weer hergebruikt mogen worden door anderen. Let op dat gebruikte afbeeldingen in blogposts niet zomaar hergebruikt mogen worden.

Site Admin | Theme by Niyaz Vakblog – werken met informatie © 2006-2012