Google (nooit) in … Google uit
Daar waar hele volksstammen bezig zijn met hun pagerank in Google om vooral maar zo hoog mogelijk in de zoekresultaten te komen van deze zoekgigant, was ik afgelopen week bezig enkele kleine sites en een weblog juist buiten Google te houden. Omgekeerde SEO dus.
Op deze pagina vind je een uitleg hoe je op je eigen site(s) dingen kunt aanpassen die ervoor zorgen dat de inhoud niet meer meegenomen wordt. Ik had in het verleden altijd braaf de robots.txt optie gebruikt om Google buiten de deur te houden maar kwam er dus recent achter dat dan wellicht de inhoud niet geindexeerd wordt maar dat de url zelf gewoon opduikt in de zoekresultaten. Matt Cutts van Google legde dat uit op YouTube, lekker simpel met een marker op een whiteboard:
Kortom, met enkele eenvoudige aanpassingen in de header van de pagina’s (het handigste via een template in te stellen zodat je dat niet op elke pagina afzonderlijk hoeft in te stellen) zorg je ervoor dat Google de inhoud en zelfs de URL negeert van de site. De ironie is wel dat je dus eigenlijk Google de site moet laten indexeren zodat je kunt zeggen dat die niet getoond mag worden. De volgende tag opnemen in de header/template voldoet dan:
<meta name=”robots” content=”noindex,nofollow”/>
Voor 1 site heb ik de .htaccess aangepast in de map op de server door die ene regel toe te voegen:
Header set X-Robots-Tag “noindex, nofollow”
Dat werkte perfect maar een tweede site bij een andere webhost gaf vervolgens een error melding en moest ik alsnog de templates aanpassen van de site zelf.
Boeiend is wel de vraag hoe je nu eigenlijk test of het werkt. Als het namelijk goed werkt zie je er dus nooit wat van terug in Google maar je wilt daar ook niet te laat achterkomen. Om nou de sites aan te melden bij Google gaat me ook wat te ver dus ik heb geloof ik maar eens vertrouwen dat het gewoon werkt zoals het zou moeten werken.
Oh ja, ben je toch te laat geweest en wil of kun je niet wachten tot Google na enkele dagen de index bijgewerkt heeft? Dan kun je, als je zelf eigenaar bent, ook een verzoek indienen om webpagina’s te laten verwijderen. Dit is echter maar voor de periode van 90 dagen waarna Google de site opnieuw zal indexeren, wat je natuurlijk voldoende tijd geeft om de aanpassingen te maken of de pagina(‘s) in kwestie te verwijderen. Dit is de methode die we in het begin gebruikt hebben om enkele zoekresultaten in Google voor de HBO Kennisbank te laten verwijderen aangezien er toen onverwachts prive gegevens van oud studenten getoond werden.
Soortgelijke posts:
- Ziet er patent uit
- Even kort … Google Latitude en opslagruimte bij Google diensten
- Even kort … Google hackje voor definities zoeken
- CoComments weer uit
- Waarom ik nooit met DRM beveiligde muziek heb gekocht
Leuk? Niet leuk? Interessant? Irritant? Als je iets vindt van deze post, plaats gerust een reactie of abonneer je op de RSS feed.





Reacties
Nog geen reacties.
Geef een reactie