duplicate content

 

Wat is Duplicate Content
Duplicate Content

Er is sprake van duplicate content wanneer twee of meerdere pagina’s dezelfde of zo goed als dezelfde inhoud hebben. Het heeft enkel met de content te maken, niet met vormgeving. Wanneer verschillende pagina’s meer dan 70% identiek zijn, beschouwt Google dit als duplicate content wat nadelig kan zijn voor je ranking. Duplicate content kan voorkomen op eenzelfde domein (identieke pagina’s) of op verschillende domeinen (bv gekopieerde inhoud).

eigenlijk?

Duplicate content betekent dat je vrijwel dezelfde inhoud hebt op 2 verschillende pagina's.
Exacte cijfers zijn er niet maar er wordt van uitgegaan dat wanneer 70% van de tekst identiek is, we spreken over duplicate content.

We onderscheiden twee vormen van duplicate content:

Interne duplicate content:

In dit geval vinden we 2 of meer dezelfde pagina's binnen één website. Mogelijke oorzaken zijn:I

  • je gebruikt dezelfde metadata voor verschillende pagina's
  • je website is vindbaar onder http://www.domeinnaam
    domeinnaam

    Een domeinnaam is de omschrijving van een IP-adres en is meestal opgebouwd uit een subdomein (www), de eigenlijke naam (domein) en de extensie (.be). De keuze van een domeinnaam is belangrijk en kan zowel een trefwoord bevatten als bv de naam van je bedrijf. Kies steeds een domeinnaam die gemakkelijk te onthouden is en goed leesbaar is.
    .be en onder http://domeinnaam.be
  • je website wordt getoond met http en https
  • in webshops ontstaat duplicate content wanneer een product terugkomt in verschillende categorieën of wanneer een product beschikbaar is in bv verschillende kleuren, maar telkens dezelfde omschrijving heeft

 

 

Externe duplicate content:

We spreken over externe duplicate content, wanneer op het internet 2 of meer pagina's vindbaar zijn met nagenoeg dezelfde content op verschillende websites. Mogelijke oorzaken zijn:

  • je kopieert inhoud van een andere website en plakt die op je eigen website
  • je publiceert je artikel op verschillende websites
  • je gebruikt de standaard tekst van je fabrikant (bv. bij produktomschrijvingen)
  • er staat een website met .be en een identieke website met .nl online
 

Wat zijn de gevolgen van duplicate content?

Een groot misverstand is dat zoekmachines je afgestraffen voor Duplicate content. Wat wel klopt is dat je pagina mogelijk minder goed geïndexeerd zal worden. Maar wat is het verschil tussen 'afgestraft worden' en 'minder goed geïndexeerd worden'?

Het streefdoel van Google is om steeds het meest relevante antwoord te geven op een zoekopdracht. Wat Google niet zal doen is in de zoekresultaten 5x hetzelfde antwoord geven. Dat verklaart niet alleen waarom duplicate content niet in de zoekresultaten zal voorkomen maar ook waarom identieke metadata beter vermeden wordt. 
Ziet Google 5 pagina's met dezelfde inhoud, dan zal hij dus kiezen welke pagina getoond wordt in de zoekresultaten, de andere pagina's worden niet echt afgestraft maar worden gewoon niet getoond.

Bestaat je website grotendeels uit gekopieerde inhoud dan zal dit wel zeer nadelig zijn voor je ranking. Als de Googlebot op je website komt en tijdens het crawlencrawlen

Dit kan ook indexeren genoemd worden want dat is wat Google wereldwijd doet op alle websites met een zogenaamde “bot” die van link naar link loopt. Daar wordt een kopie van gemaakt en bijgehouden op de eigen computers van Google, de index dus. Alle resultaten die je zo snel krijgt wanneer je een zoekopdracht ingeeft komen uit die index en niet rechtstreeks van het internet. Voor een goede vindbaarheid van jouw site is het belangrijk dat hij goed kan gecrawld worden.

een heleboel duplicate content ontdekt, is de kans immers groot dat hij het opgeeft waardoor je pagina's niet meer geïndexeerd worden.
In extreme gevallen zal er zelfs een penalty volgen voor de hele website maar dan moet je het al behoorlijk bont maken.

 

duplicate content 2Hoe kiest Google welke pagina hij toont?

In principe weet Google op welke pagina het oorspronkelijke artikel staat en zal hij daar voorrang aan geven. Helaas is het niet altijd zo eenvoudig.

Stel dat er duplicate content voorkomt op twee websites met een opvallend verschil in gebruiksvriendelijkheid. Is je eigen website bv niet mobielvriendelijk
mobielvriendelijk

Een website die niet mobielvriendelijk is, wordt niet goed getoond op tablet en smartphone. Aangezien mensen steeds meer gebruik maken van mobiele toestellen om te surfen, te bestellen en te reserveren is een mobielvriendelijke website een absolute noodzaak. Ook Google houdt rekening met de mobielvriendelijkheid van je website.
en die van je concurrent met het gekopieerde artikel wel, dan is het zeer goed mogelijk dat toch zijn website in de zoekresultaten getoond wordt en de jouwe met het originele artikel niet. Een geoptimaliseerde website is dus een absolute must.

Soms slaagt Google er ook gewoon niet in om te ontdekken welke pagina het originele artikel bevat waardoor het ook kan gebeuren dat niet de oorspronkelijke auteur getoond wordt.
Het is dus altijd beter om duplicate content te voorkomen.

Hoe spoor je duplicate content op?

Er zijn verschillende manieren om duplicate content op te sporen:

  • Kopieer een stuk tekst uit je website en voer dat in in de Google zoekbalk tussen dubbele aanhalingstekens. Google geeft in de zoekresultaten weer op welke websites die tekst werd gevonden.
  • Maak gebruik van copyscape.com. Op deze website geef je de urlurl

    De definitie van URL is Uniform Resource Locator. Elk item op internet heeft een eigen uniek adres in de vorm van een url waarbij de locatie op het internet wordt weergegeven. Een url kan bv zijn https://id4web.be/webdesign, waarbij verwezen wordt naar de pagina webdesign op mijn website.

    in van je website en vervolgens gaat het systeem op zoek naar dubbele content op het internet.
  • In Google Search ConsoleGoogle Search Console

    Google Search Console is een gratis tool van Google waarmee je de prestaties en vindbaarheid van je website kan meten. Een absolute must-have voor iedereen die gericht met SEO bezig is.
    klik je onder Index op dekking. Met de status 'uitgesloten', geeft Google aan dat die pagina's als dubbel worden aanzien binnen je website.

Hoe kan je duplicate content voorkomen of oplossen?

  • Vermijd het overnemen van teksten van andere websites of fabrikanten. Zoek informatie en herschrijf die vervolgens op jouw manier.
  • Heb je een website met duizenden producten, concentreer je dan op je beste of mee winstgevende producten en schrijf daar aparte teksten en metadata voor of vul de tekst van je fabrikant aan met eigen informatie.
  • Gebruik de tag rel="canonical" voor de pagina die niet de oorspronkelijke tekst bevat. Je laat Google daardoor weten welke je voorkeurs-url (of canonieke url) is. De tag wordt toegevoegd in het <head>-gedeelte van je pagina en ziet er als volgt uit:
    link rel="canonical" href="http://www.mijnsite.be"/>.
    De canonical tag kan je gebruiken voor bv producten die onder verschillende categorieën getoond worden maar ook voor een product dat bv verkrijgbaar is in 3 verschillende kleuren maar verder identiek is.
  • Geef in de Google Webmaster Tool aan welk je voorkeursdomein is (http://www.mijndomein.be of http://mijndomein.be)
  • Gebruik je robots.txt file om bepaalde pagina's niet te laten indexerenindexeren

    Waneer de zoekmachines je websitepagina’s indexeren, nemen ze die pagina’s op in hun database zodat die kunnen getoond worden als er een relevante zoekopdracht wordt geplaatst.


    door de zoekmachines.
  • Wacht tot je pagina geïndexeerd is voor je je blogartikel aanbiedt aan andere websites.
    Je kan dit controleren door het volgende in Google in te geven: site:http://www.mijnsite.be, je krijgt dan een overzicht van alle geïndexeerde pagina's. Je kan ook één specifieke pagina ingeven ter controle. Wil je niet wachten, dan kan je via Google webmaster tools ook een indexering van je pagina aanvragen.
  • Pak plagiaat aan. Heeft iemand content overgenomen zonder toestemming te vragen, neem dan contact op en vraag om de inhoud te verwijderen. In het slechtste geval kan je zelfs een verzoek tot verwijdering indienen bij Google.

 

Nog problemen met duplicate content?

Heb je nog vragen over duplicate content of is er iets niet duidelijk. Plaats dan je vraag of opmerking hieronder of neem contact op via martine@id4web.be.

Reacties mogelijk gemaakt door CComment