Regelmatig krijg ik de vraag wat duplicate content nu precies is en wat de gevolgen hiervan kunnen zijn. Laat ik beginnen door te vertellen dat duplicate content inderdaad een probleem kan zijn. Duplicate content (of gedupliceerde inhoud) is simpel gezegd twee of meer pagina’s die identiek zijn qua inhoud.
Duplicate content kan op twee manieren voorkomen, op je eigen website (intern) of op een andere website (extern).
Waarom is duplicate content een probleem?
Wanneer er sprake is van duplicate content wil dat dus zeggen dat er twee of meer pagina’s zijn met dezelfde inhoud. Voor Google heeft in principe maar één pagina waarde, de andere pagina’s bieden in ieder geval géén toegevoegde waarde. Met andere woorden, deze andere pagina’s zijn eigenlijk een vervuiling voor de index van Google.
Dat is precies de reden dat Google duplicate content “bestraft”. In veel gevallen kan Google wel zien wie de originele pagina gepubliceerd heeft, en zal de andere pagina’s dus “bestraffen”. Maar let op, dit is niet altijd het geval! We kunnen er dus maar beter voor zorgen dat we duplicate content voorkomen.
Duplicate content intern
De meeste pagina’s van je website zijn uniek. Je contactpagina bevat bijvoorbeeld hele andere inhoud dan je productpagina. Toch zijn er een aantal pagina’s die wel erg veel op elkaar kunnen lijken:
- Binnen e-commerce sites kan het zijn dat een categoriepagina dezelfde producten bevat als bijvoorbeeld een zoekpagina;
- Printvriendelijke pagina’s.
Voor beide problemen zijn er eenvoudige oplossingen. Voor het e-commerce probleem kun je het canonical attribuut gebruiken. Het probleem van de printvriendelijke pagina’s is op te lossen door de toegang tot deze pagina voor Google te ontzeggen. Dit doe je door de metatag: <meta name=”robots” content=”noindex” /> aam de pagina toe te voegen (in het “head” gedeelte).
Duplicate content extern
Bij externe duplicate content kunnen we twee soorten onderscheiden, duplicate content die we zelf plaatsen en duplicate content waarbij anderen onze teksten overnemen.
Duplicate content eigen schuld
Bij deze vorm hebben we dus (bewust of niet) content op onze website geplaatst die ook al op andere websites voorkomt. Wanneer je dit bewust hebt gedaan om adviseer ik je om dit niet te doen. Je schiet er niets mee op. Ten eerste zal Google je hiervoor “bestraffen” en ten tweede is het niet erg aardig ten opzichte van de originele publiceerder.
Maar er zijn ook situaties waarbij je onbewust duplicate content op je website plaatst. Het meest voorkomende voorbeeld wat ik hier kan geven is die van de productomschrijvingen in webwinkels. Het merendeel van de webwinkeliers gebruikt de productomschrijving die ze van de fabrikant of leverancier hebben gekregen. En die productomschrijvingen komen dus ook bij andere (concurrenten) terecht.
Mijn advies hier is dus om unieke productomschrijvingen te maken. Dit heeft twee voordelen, ten eerste heb je geen last meer van duplicate content (en je concurrenten nog wel ;-) ) en ten tweede kun je teksten schrijven die meer verkoopgericht zijn. Een win-win situatie dus!
Duplicate content, schuld van anderen
Bij deze vorm ben je dus de dupe van webmaster die jouw teksten kopiëren. Geen goede zaak natuurlijk. Mijn advies is om dergelijke website zo snel mogelijk te identificeren en de webmasters te sommeren jouw inhoud van hun website af te halen!
Duplicate content controleren
Er zijn verschillende manieren en tools om te controleren of dat je website de dupe is geworden van duplicate content. Hieronder vind je enkele van deze tools:
- Copyscape: de meest bekende. Vul hier eenvoudig je de url van je webpagina in en je ziet meteen welke websites jouw content hebben geplaatst;
- Google: Eenvoudig maar effectief. Vul gewoon een stuk tekst van je website in (plaats deze dan wel tussen aanhalings- en sluitingstekens) en je ziet op welke pagina’s deze content nog voorkomt.
Via Shimon Sandler



Voor zover ik weet wordt een pagina met duplicate content niet bestraft door Google maar loop je het risico dat deze pagina uit de zoekresultaten wordt gefilterd.
Het is jammer dat je dit niet terug ziet in de google webmastertools. Je ziet wel de duplicate titels maar niet de duplicate content. Wie weet komt dit nog in een nieuwe versie :-)
Zelf uitvoerig aan het testen met duplicate content op verschillende sites en geen enkel ‘probleem’ te bespeuren zolang titel en meta description niet hetzelfde zijn..
Mijn voorlopige conclusie is dus dat er geen duplicate content probleem bestaat tussen verschillende domeinen.
Intern zou inderdaad een probleem zijn maar ook daar wil ik wel eens op testen :o
Je bedoelt dus dat beide pagina’s worden weergegeven in de zoekresultaten? Lijkt me sterk…
Ik ben beniewd……
Sterk in zwaar werk maar toch is het zo..en G blijft ze wekelijks bezoeken.
Meer nog, ik ken iemand die met duizenden pagina’s aan het testen is en allen staan in G’s index.
Groot probleem in de SEO wereld is het feit dat alles ‘zomaar’ wordt aangenomen en er zelf nooit onderzoek wordt na gedaan. Als een grote naam zijn mond opendoet en zegt dat de sneeuw zwart is dan volgt 98% :o
Kijk hier eens naar en vooral naar de reacties eronder:
http://www.youtube.com/watch?v=z07IfCtYbLw
Ben trouwens erg benieuwd naar je testgegevens Dave!
Google is God niet :o Volgens hun kan je ook niet in de top 10 komen als je niet volgens hun regels speelt…
Er zijn menige zeer compet. markten waar spammers al jaar en dag in de top 10 staan.
Wat wil je nu eigenlijk iedereen aanraden Dave? Om je niets van duplicate content aan te trekken?
Ik raad iedereen aan om G niet voor de voeten te lopen :o Dus als ze zeggen dat duplicate content ’slecht’ is dan hou je dat beter in je achterhoofd…
Maar ik zie nu wel dat ze niet echt in staat zijn om duplicate content op verschillende domeinen ‘af te straffen’…
Wat wij hebben ervaren is het volgende :
Duplicate content werd niet gestraft maar de ‘beste’ pagina die voldeed aan de zoekopdrachten voor de keywords werd opgenomen.. de rest wordt ook gecached maar deze pagina’s vonden wij niet terug in de eerste 100 resultaten. Verder zijn we niet gaan zoeken.
Ik heb google al meerdere malen aangegeven via het abuse formulier dat een andere pagina meerdere pagina’s met content heeft gekopieerd maar die doen er helaas tot nu toe ook nog weinig mee. Iemand ervarind dat het abuse formulier ook echt zinnig is?
Welk abuse formulier heb je precies gebruikt?
Ik heb op dit weblog van Karelgeenen een artikel geschreven over 8 usabilityfouten. Dit artikel heb ik ook geplaatst op mijn eigen weblog http://www.qonvert.com.
Van dit artikel zijn de titel en metadesription anders. Ook heb ik een paar woorden in de tekst aangepast. Echter, niet zoveel woorden.
Geen van beide artikelen wordt geweerd uit de Google index.
Ik ben geneigd om mij bij Dave aan te sluiten.
Het artikel op Karelgeenen.nl staat wel hoger gëindexeerd ;-) Goed werk Karel
Alle pagina’s ranken. Wel nog even zeggen dat ze niet exact dezelfde keyword combinatie in het vizier hebben. Laten we zeggen dat als we voor artikel A de combo “Grote hondenmanden” nemen, dan nemen we voor de copy “Grote lederen honden manden”
Voorlopig werkt het en ik denk ook niet dat Google daar gelijk iets kan aan doen. Natuurlijk dat ze zelf het omgekeerde vertellen, hoe zou je zelf zijn als je index overspoeld wordt met content :o
Maar hoe zit dat dan met affiliate progra
mma’s? Daar wordt te pas en te onpas teksten overgenomen van webwinkels…..en zou meer omzet moeten genereren. Maar dat haalt dus op deze manier je eigen vindbaarheid naar beneden……??? Of zit ik er helemaal naast??
De originele publisher zal, mits deze als eerste is geïndexeerd, boven de anderen vertoond worden.
Ik volg Dave in zijn bevindingen. Zelf ben ik ook bezig met enkele blogs te maken met teksten die voor 80-85 % duplicate content zijn van andere sites. Waarom? Enkel om te testen als ik hoger kan ranken dan sites die al jaren over dit onderwerp schrijven en dus een streepje voor zouden moeten hebben bij Google. Als je de teksten optimaliseert, ook al is het maar door het gebruik van meer keywords, links tussen je eigen artikels,… kan je al een hele sprong maken in de zoekresultaten.
Onderwerpen waar weinig concurrentie is, geven binnen enkele dagen al heel goede resultaten.
Ik neem wel de moeite om een passende inleiding te schrijven met veel keywords, maar de rest van de tekst blijft nagenoeg onaangeroerd en dit heeft tot op heden (nog) geen gevolgen voor de Google zoekresultaten. Andere zoekmachines gebruik ik momenteel nog niet om te testen, dit laat ik dus even links liggen in mijn reactie.
Wij plaatsen heel veel gedupliceerd content en worden ook regelmatig benaderd om content (lees nieuwsartikelen) te plaatsen die ook al op de site van de organisatie staan.
Bijv. samefeelings stuurde ons een nieuwbericht dat wij geplaatst hebben, waarschijnlijk zijn we niet de enige.
Het is dus toch aan te raden om de Titel en H2 / H3 iets te veranderen, begrijp ik hieruit.
Ik heb zelf ook al enige tijd last van duplicate content, omdat een website van mij ( http://www.minisudoku.nl ) meerdere keren volledig is geript, en zelfs ter download werd aangeboden!
Van de tot nu toe 11 gevonden kloons zijn er al 8 offline (gedwongen via email). En van de 24 download locaties is ongeveer driekwart offline.
De oorzaak heb ik al gevonden, een Nederlander heeft mijn website geripped, in de footer geplaatst ‘Cloned by Torrentbay.nl’ en deze vervolgens naar meerdere download sites geupload. Daardoor denken sommigen dat het vrij te gebruiken is, en plaatsen ze het online.
Ook vervelend is dat de hoster van de belangrijkste kloon (HostGator) vereist dat een DMCA (Digital Millennium Copyright Act) per fax wordt opgestuurd. Digitaal ondertekende email kan ook, maar tot nu toe werden al mijn emails teruggestuurd (omdat het niet digitaal ondertekend zou zijn, wat ze wel zijn).
@Jacob al gerechtelijke stappen ondernomen ? Niet dat het veel zal uitmaken wss maar het schrikeffect kan wel iets opleveren.
Nee, de eigenaar van de belangrijkste kloon zit ergens in Azië. Ik denk dat eventuele gerechtelijke stappen me meer zullen kosten dan opleveren.
Als er ergens veel duplicate content staat is het wel op een forum wat ik heb.
Lezers plaatsen berichten uit de media waarover vervolgens gepraat wordt.
Via Google worden we juist gevonden op het originele bericht.
De plek waar het bericht vandaan komt scoort vaak enige resultaten lager.
Mij mening is dus dat duplicate content op dit moment nog geen problemen oplevert.
@Dave
Amen :)
Er bestaat in mijn ervaring ook geen straf voor duplicate content.
Maar vanuit user experience is het volkomen logisch dat Google en andere zoekmachines niet dezelfde of identieke content meerdere malen teruggeven in de zoekresultaten.
Het is dus zaak dat je als de autoriteit wordt gezien. Met interne duplicate content kun je dit eenvoudig oplossen. Met externe content is het lastiger, maar zeker niet onmogelijk ;)
Mooie discussie :)
Ik durf eigenlijk nog geen kant te kiezen, al ben ik uit principe wel iemand die duplicate content liever ziet gaan dan komen.
Voor de personen die info doorplaatsen zou ik liever zien dat ze een deel doorplaatsen en voor het hele artikel doorverwijzen naar de bron.
Content is niet voor niets eigenlijk het grootste probleem voor een nieuwe website. Iedereen struikelt erover en wat is dan makkelijker om content te stelen ipv te maken.
Bij product omschrijvingen is het gezien de hoeveelheid ook nog eens heel veel werk om dit aan te passen, maar zoals Karel zegt kan het dus wel een groot voordeel opleveren als je hier een copywriter z’n gang laat gaan.
Erg lastig ook met webshops e.d.
Je krijgt vaak de product specs van de leverancier welke iedereen gebruikt. Alles herschrijven is ook erg moeilijk
Om duplicate content binnen je eigen site te achterhalen, kun je ook atijd een tool gebruiken zoals deze bijvoorbeeld: http://www.webconfs.com/similar-page-checker.php
Ik deel overigens de mening dat duplicate content een groter probleem vormt binnen de pagina’s van 1 site dan tussen verschillende sites. En eigenlijk is dat wel logisch ook.
Ik heb overigens nog een handige tip om automatisch een melding te krijgen van duplicate content: kopieer een stukje tekst van je website en maak hiervoor een Google Alert aan. Zo krijg je van Google een email als het stukje tekst ergens gevonden wordt.
Ik merk dat de originele post niet perse boven de andere gaat ranken . Hangt vooral af van de ’sterkte’ van de site en de inkomende links naar het betreffende artikel.