Duplicate content kan een lastige factor zijn in je SEO en je resultaten danig in de war gooien. Om de zoekmachines te helpen met het vinden van de originele URL is er een nieuwe manier om je pagina's te voorzien van een kenmerk met daarin de originele URL.
Voordat we aan deze nieuwe 'oplossing' toekomen ga ik eerst even wat dieper in op het probleem. Want wat is er nu aan de hand met duplicate content op je eigen site.
Hoe ontstaat Duplicate content op je site
De zoekmachines komen via allerlei links op jouw site en lezen de pagina. Vervolgens wordt de pagina hopelijk in de index van Google opgenomen en kan deze een aanzienlijk hoeveelheid bezoekers naar je site brengen.
In sommige gevallen echter vind een zoekmachine dezelfde pagina achter een andere URL. Dit kan bijvoorbeeld gebeuren als je variabelen aan een URL toevoegt. Stel je voor dat je linkpartners zoekt voor www.mijnsite.nl maar je wilt voor je linkscript bijhouden hoeveel bezoekers elke link je brengt. Je kan dan een variabele toevoegen waardoor de link er bijvoorbeeld als volgt uitziet: www.mijnsite.nl/?linkpartner=siteX of bijvoorbeeld www.mijnsite.nl/?linkpartner=siteY. Twee verschillende URL's die naar dezelfde pagina leiden.
Er zijn nog veel complexere vormen denkbaar, bijvoorbeeld bij sommige webshop scripts waar allerlei variabelen worden toegevoegd aan een product pagina. Berucht is het voorbeeld waarbij de categorie in de URL staat en een product in meerdere categorieën is opgenomen. Ook kan het zijn dat je de URL van een pagina veranderd hebt en de oude URL (met inhoud) laat bestaan in plaats van deze door te verwijzen naar de nieuwe URL. Een andere berucht probleem is die van de print pagina's. De layout is printvriendelijk als in de URL bijvoorbeeld een variabele wordt toegevoegd dat sprake is van een printpagina. De inhoud van de pagina is echter gelijk.
Wat is het probleem van duplicate content
Heel kort door de bocht heeft de zoekmachine nu meerdere URL's in haar database staan met min of meer dezelfde inhoud. De zoekmachine wil mensen die zoeken niet keer op keer dezelfde pagina laten zien dus besluiten ze 1 origineel te kiezen die in de index komt. De andere versies van de pagina worden als duplicate content aangemerkt en score waarschijnlijk een stuk lager of worden zelfs niet opgenomen in de index.
Dit betekent ook dat links naar die duplicate content pagina's in een soort black box verdwijnen en misschien wel minder of niet meetellen in de populariteit van de originele pagina. Wat je eigenlijk wil is dat al die varianten van de originele URL bijdragen aan de kracht en populariteit van de originele URL. Je kan dan de originele pagina goed laten scoren in de zoekmachines en tegelijkertijd allerlei variabelen meegeven aan de URL voor intern gebruik.
Wat is de oplossing van de zoekmachines
Google, Yahoo en Microsoft adviseren nu het opnemen van een tag waarin je aangeeft wat de aangeraden URL voor die pagina is. Je zet dus in een productpagina deze tag met de URL die volgens jou het origineel is en zorgt dat deze tag met URL op alle varianten van die pagina opgenomen wordt. Op deze manier weten de zoekmachines welke URL de originele URL is.
Overigens is het hiermee nog niet gegarandeerd dat de zoekmachines jouw URL opnemen. Ze zien de URL die in deze tag is opgenomen als een hint en voelen zich niet verplicht deze te volgen. De zoekmachines geven wel aan dat ze een sterke waarde gaan hechten aan deze tag. Of het werkt zal dus alleen de toekomst en veel testen kunnen uitwijzen.
Hoe neem je de juiste URL op
De code die je op je pagina's moet opnemen is de volgende. Je vervangt de domeinnaam door jouw domeinnaam en zorgt dat de URL goed is ingevuld.
<link rel="canonical" href="http://www.mijnsite.nl/originele-url" />
Ondertussen zijn er ook al enkele plugins die je helpen om deze tag te implementeren. Kijk allereerst in het artikel over canonical URL links op Yoast.com en daar vind je een link naar een Wordpress plugin en een link naar een Drupal module.
Blijf op de hoogte
Vond je deze informatie interessant, zorg dan dat je het laatste nieuws en de beste kortingen via onze nieuwsbrief ontvangt. Schrijf je nu in >>>
Je kan je natuurlijk ook op onze RSS feed inschrijven en het nieuws volgen via je eigen RSS Reader.
{ 7 reacties }
Ik denk dat Google duplicate content helemaal niet bestaat.
http://www.positie1.nl/google-seo-mythen-1
Als je genoeg backlinks voor je site regelt, bestaande content of niet, dan maakt het volgens mij niet uit. Google zal je site toch wel ranken. Minder hoog, dat misschien wel.
Backlinks is nog steeds de key en zolang je backlinks weet te krijgen hoef je je als webmasters niet druk te maken om duplicate content.
Duplicate content bestaat wel degelijk. Zoals je terecht aangeeft is de vraag wat de gevolgen zijn van deze duplicate content.
In het artikel waarnaar je verwijst geeft Ilonka aan dat ze denkt dat er geen penalty gegeven wordt voor duplicate content. Wel is het zo dat je pagina’s lager in de serp’s kunnen komen.
Voor mij gaat het juist om de ranking in de serp’s en het verkeer dat ik uit Google krijg. Duplicate content kan mijn verkeer verminderen en is in ieder geval voor mij een belangrijk aandachtspunt.
Interne duplicate content
Als je op je eigen website dezelfde content bereikbaar maakt onder verschillende url’s dan kiest google 1 url. De links die naar de andere urls verwijzen helpen je dan niet meer mee. Mede door het gebruik van de canonical url zoals hierboven beschreven kun je dit probleem te lijf gaan.
externe duplicate content
Als iemand jouw artikelen jat en ze beter kan positioneren in Google kan het zomaar zijn dat Google jouw pagina als de kopie gaat zien waardoor je minder goed scoort in Google.
Zeker iets om in de gaten te houden en contact op te nemen met de betreffende webmaster om je auteursrecht te claimen.
Interessante kost Erik.
Laatst leerde ik van Hans Keerens van Qonvert dat bij een blog duplicate content kan ontstaan als je ieder artikel op de homepage integraal weergeeft, en dus afziet van het afbreken na de lead samen met een link ‘Lees verder ‘. Ik vind het vreemd dat Google dit als dubbele content ziet, want het gaat toch om dezelfde post. Weet jij hier het fijne van?
Laatste blogpost van Aartjan van Erkel:SEO-copywriting kost conversie
Als het dezelfde post is die achter twee url’s te bereiken is dan heb je duplicate content. Juist als het dezelfde post is zou je verwachten dat sprake is van 1 artikel en dus ook maar 1 url. Door een artikel op de homepage en de artikelpagina te zetten maak je twee dezelfde versies van 1 artikel.
Google wil relevante resultaten leveren dus wil van elk artikel maar 1 versie opnemen in de index. Bij voorkeur nemen ze het originele artikel op en laten ze de kopie zitten. De index is nu nog steeds compleet want elk artikel staat er 1 keer in.
De vraag blijft of Google de homepage of de artikelpagina als origineel ziet. Dit zou de artikelpagina moeten zijn aangezien er op de homepage steeds een nieuw artikel staat. Vandaar dat je de homepage unieke content moet geven en niet een kopie moet laten zijn van een artikelpagina.
Ik dacht overigens dat je minder snel duplicate content hebt als je meerdere teasers/artikelen op de homepage zet. Gaat die opmerking van Hans Keerens over 1 artikel op de homepage of over meerdere full teasers? Heb je een bron?
Hallo,
Vraag over de Canonical. Tijdens het aanmaken van een artikel in Wordpress, kan je de canonical link aangeven. Er treed echter een probleem op. Dit artikel komt in een categorie/archief en heeft een eigen pagina. Ik stel ook excerpts in. Wanneer deze op de home verschijnt als excerpt van een nieuw artikel, dan staat er in de head van de home en op de artikelpagina zelf, de canonicallink van het artikel.
Hiermee lijkt te worden aangegeven dat de home eigenlijk wordt doorverwezen naar de artikelpagina. Op de pagina zelf van het artikel staat die link ook. Is dat niet verkeerd? Deze link moet toch alleen komen op pagina´s waar dit artikel staat, met uitzondering van de home en de pagina zelf?
BVD.
De canonical van een artikel moet niet terecht komen op de homepage. Daar staat als canonical de url van de homepage zelf. Als er meerdere excerpts op de homepage staan, zijn er dan ook meerdere canonical urls?
Je zou nog eens kritisch kunnen kijken naar je instellingen en/of theme om te checken of je die canonical kan verwijderen als er excerpts getoond worden.
Hoi,
Ja er staan meer excerpts op de home… maar slechts 1 canonical….