Ongewenste tekst voor de Google spider verbergen

4 June, 2009

in Archief

random 300x242 Ongewenste tekst voor de Google spider verbergenEdit: Onderstaande werkt alleen voor Google Search Appliance / Google Mini. Meer lezen kan op code.google.com.

In de Hidden text klinkt black hat. Dat is het ook als je het doet om de zoekmachines te spammen. Je presenteert dan tekst aan de zoekmachines die je niet laat zien aan de gebruiker.

Het kan ook andersom kwam ik net achter, tekst wel aan de gebruiker laten zien maar niet aan Google. Je kan tags in je HTML zetten die voorkomen dat bepaalde delen van je pagina geindexeerd worden. Dit kan bijvoorbeeld handig zijn als je bepaalde termen wilt uitsluiten van de snippet.

Ik denk even aan de eerdere Google snippet casus waarbij dit bijzonder handig zou zijn geweest.

Benedenstaande geldt alleen voor Google. Aangezien deze de belangrijkste zoekmachine in Nederland is heb ik vooralsnog geen onderzoek gedaan naar andere zoekmachines.

Tekst uitsluiten van de Google snippet

De laatste tijd is er nogal wat discussie over de Google snippet. In een recente rechtszaak is de webmaster verantwoordelijk gehouden voor de Google snippet en heeft de webmaster de snippet moeten aanpassen.

Het probleem ontstond doordat de webpagina naast de pagina over een autobedrijf ook de laatste reacties had staan van de hele site. In die reacties stond het woord "failliet" waardoor de betreffende pagina hoog scoorde in Google op de combinatie van "failliet" met de naam van het autobedrijf.

Het is mogelijk om bepaalde teksten uit te sluiten van opname in de snippet. Door bijvoorbeeld de ongerelateerde reacties uit te sluiten voor de snippet is het onwaarschijnlijk dat Google een snippet kan fabriceren die een combinatie is van het onderwerp van een pagina en ongerelateerde reacties die ook op dezelfde pagina staan.

Een ander voordeel is dat de snippet meer up to date is. Door het tonen van de laatste reacties op een pagina zal Google deze indexeren. Echter als er veel reacties geplaatst worden dan zijn deze soms binnen enkele dagen van de pagina verdwenen terwijl ze nog wel in Google staan.

<!--googleoff: snippet-->ongerelateerde reacties<!--googleon: snippet-->

Een fantastische manier om te zorgen dat de ongerelateerde reacties niet de zoekresultaten van de betreffende pagina vervuilen.

Zoekwoorden waar je niet op gevonden wilt worden

Soms wil je op bepaalde termen niet gevonden worden. Dit kan handig zijn als je bijvoorbeeld je e-mail adres wilt uitsluiten van indexatie of je adres niet in Google wil hebben staan.

Je gebruikt daarvoor de volgende code:

<p>U kunt ons bereiken via <!--googleoff: index-->erik@wwohn.nl<!--googleon: index--> of ons contactformulier</p>

Het e-mail adres dat tussen de tags staat zal niet geindexeerd worden en bij een zoektocht op deze term zou de betreffende pagina niet in de zoekmachine moeten komen. Tenzij je het e-mail adres op een andere plek op de pagina ook noemt.

Anchortekst loskoppelen van de doelpagina

Als je een link opneemt met een anchor tekst dan wordt de anchor tekst gekoppeld aan de betreffende pagina. In een perfecte wereld zou de betreffende doel pagina vindbaar zijn op de anchor tekst van de links die naar deze pagina wijzen.

Je kan de anchor tekst loskoppelen van de doelpagina via de volgende code.

<!--googleoff: anchor--><a href="bestel-pagina.html">bestellen</a><!--googleon: anchor-->

Deze hyperlink zou er normaal voor zorgen dat bestel-pagina.html vindbaar wordt op het woord bestellen. Wellicht dat je liever hebt dat een andere pagina scoort op het woord bestellen. Met deze tags kun je de concurrentie voor dat zoekwoord binnen je site verminderen.

Geen snippet, zoekwoord en anchortekst

Je kan ook alle drie hierboven genoemde items in een keer uitschakelen. Je gebruikt dan tags waarbij de tekst binnen deze tags niet in de snippet terecht komt, niet in de google index en niet als anchor tekst verbonden wordt met andere pagina's

<!--googleoff: all-->Dien hier een klacht in<!--googleon: all-->

Conclusie

Het lijkt er dus op dat je in grote mate invloed kan uitoefenen op indexatie van een gedeelte van de inhoud van je pagina. Of dit handig is hangt heel erg af van de specifieke situatie. In ieder geval ben ik gefascineerd door de toepassing waarbij je bepaalde tekst kan uitsluiten van indexatie.

Wellicht ga ik mijn menu en teasers voor andere artikelen op de site eens tussen deze tags zetten.

Weet jij nog voorbeelden waarbij deze tags handig kunnen zijn?

Bron: code.google.com

Edit: Onderstaande werkt alleen voor Google Search Appliance / Google Mini. Meer lezen kan op code.google.com.

Blijf op de hoogte

Vond je deze informatie interessant, zorg dan dat je het laatste nieuws en de beste kortingen via onze nieuwsbrief ontvangt. Schrijf je nu in >>>

Je kan je natuurlijk ook op onze RSS feed inschrijven en het nieuws volgen via je eigen RSS Reader.

{ 5 reacties }

Jens Swelson 04.06.09 om 22:29

Hmm, klinkt wel interessant. Ik zou echter zo snel voor mijzelf niets kunnen bedenken waarbij ik het zou kunnen gebruiken.

Laatste blogpost van Jens Swelson:Weer een Ibood hunt!

Peter 05.06.09 om 10:09

Je kunt de navigatie op je site op deze manier ook uitsluiten van indexering. Een ander voorbeeld: je hebt een koor en je noemt de leden van het koor op je website maar je wilt niet dat men die namen via Google vindt.

Oeroek 05.06.09 om 10:49

@Peter, idd een mooi voorbeeld waarvoor je dit kan gebruiken.

Ik zit zelf te denken aan het uitsluiten de tekst in mijn header zodat deze niet in de snippet komen.

In de header staan namelijk twee recente berichten die zeer regelmatig veranderen. ALs Google de info in die berichten in de snippet zet en mensen komen na een paar dagen naar de site vanwege die snippet dan is er een goede kans dat die recente berichten al weer vervangen zijn.

Sander Tamaëla 26.05.10 om 10:54

Een wat late reactie, maar dit werkt dus niet voor de nomale Google crawler maar alleen voor Google Search Appliance en Google Mini, beide bedrijfsoplossingen.

Oeroek 26.05.10 om 13:10

Hallo Sander,
Dank je voor je reactie. Als er dingen op mijn site staan die niet kloppen dan hoor ik ze liever laat dan helemaal niet. Ik zal het bericht aanpassen.
Erik

Previous post:

Next post: