Naar
boven

Duplicate content, vinden en voorkomen

duplicate-contentRegelmatig krijg ik de vraag wat duplicate content nu precies is en wat de gevolgen hiervan kunnen zijn. Laat ik beginnen door te vertellen dat duplicate content inderdaad een probleem kan zijn. Duplicate content (of gedupliceerde inhoud) is simpel gezegd twee of meer pagina’s die identiek zijn qua inhoud.

Duplicate content kan op twee manieren voorkomen, op je eigen website (intern) of op een andere website (extern).

Waarom is duplicate content een probleem?

Wanneer er sprake is van duplicate content wil dat dus zeggen dat er twee of meer pagina’s zijn met dezelfde inhoud. Voor Google heeft in principe maar één pagina waarde, de andere pagina’s bieden in ieder geval géén toegevoegde waarde. Met andere woorden, deze andere pagina’s zijn eigenlijk een vervuiling voor de index van Google.

Dat is precies de reden dat Google duplicate content “bestraft”. In veel gevallen kan Google wel zien wie de originele pagina gepubliceerd heeft, en zal de andere pagina’s dus “bestraffen”. Maar let op, dit is niet altijd het geval! We kunnen er dus maar beter voor zorgen dat we duplicate content voorkomen.

Duplicate content intern

De meeste pagina’s van je website zijn uniek. Je contactpagina bevat bijvoorbeeld hele andere inhoud dan je productpagina. Toch zijn er een aantal pagina’s die wel erg veel op elkaar kunnen lijken:

  • Binnen e-commerce sites kan het zijn dat een categoriepagina dezelfde producten bevat als bijvoorbeeld een zoekpagina;
  • Printvriendelijke pagina’s.

Voor beide problemen zijn er eenvoudige oplossingen. Voor het e-commerce probleem kun je het canonical attribuut gebruiken. Het probleem van de printvriendelijke pagina’s is op te lossen door de toegang tot deze pagina voor Google te ontzeggen. Dit doe je door de metatag: <meta name=”robots” content=”noindex” /> aam de pagina toe te voegen (in het “head” gedeelte).

Duplicate content extern

Bij externe duplicate content kunnen we twee soorten onderscheiden, duplicate content die we zelf plaatsen en duplicate content waarbij anderen onze teksten overnemen.

Duplicate content eigen schuld

Bij deze vorm hebben we dus (bewust of niet) content op onze website geplaatst die ook al op andere websites voorkomt. Wanneer je dit bewust hebt gedaan om adviseer ik je om dit niet te doen. Je schiet er niets mee op. Ten eerste zal Google je hiervoor “bestraffen” en ten tweede is het niet erg aardig ten opzichte van de originele publiceerder.

Maar er zijn ook situaties waarbij je onbewust duplicate content op je website plaatst. Het meest voorkomende voorbeeld wat ik hier kan geven is die van de productomschrijvingen in webwinkels. Het merendeel van de webwinkeliers gebruikt de productomschrijving die ze van de fabrikant of leverancier hebben gekregen. En die productomschrijvingen komen dus ook bij andere (concurrenten) terecht.

Mijn advies hier is dus om unieke productomschrijvingen te maken. Dit heeft twee voordelen, ten eerste heb je geen last meer van duplicate content (en je concurrenten nog wel ;-) ) en ten tweede kun je teksten schrijven die meer verkoopgericht zijn. Een win-win situatie dus!

Duplicate content, schuld van anderen

Bij deze vorm ben je dus de dupe van webmaster die jouw teksten kopiëren. Geen goede zaak natuurlijk. Mijn advies is om dergelijke website zo snel mogelijk te identificeren en de webmasters te sommeren jouw inhoud van hun website af te halen!

Duplicate content controleren

Er zijn verschillende manieren en tools om te controleren of dat je website de dupe is geworden van duplicate content. Hieronder vind je enkele van deze tools:

  • Copyscape: de meest bekende. Vul hier eenvoudig je de url van je webpagina in en je ziet meteen welke websites jouw content hebben geplaatst;
  • Google: Eenvoudig maar effectief. Vul gewoon een stuk tekst van je website in (plaats deze dan wel tussen aanhalings- en sluitingstekens) en je ziet op welke pagina’s deze content nog voorkomt.

Via Shimon Sandler

Meer leren over zoekmachine optimalisatie? Klik hier voor onze gratis e-mailcursus!

Met onze hulp bovenaan in Google?

Bekijk onze cursus zoekmachine optimalisatie, onze dienst of vul onderstaand formulier in:


Over de auteur:

Dit artikel is geschreven door .

Karel Geenen
Karel Geenen is medeoprichter van KG Online Marketing. Hierbinnen vallen dit weblog, onze Academy met online marketing cursussen en het Bureau voor online marketing diensten.
35 reacties op "Duplicate content, vinden en voorkomen"
  • Hans Keeren zegt:
    22 Jul, 2009 om 12:06

    Voor zover ik weet wordt een pagina met duplicate content niet bestraft door Google maar loop je het risico dat deze pagina uit de zoekresultaten wordt gefilterd.

    Reageren
  • Bjorn van der Neut zegt:
    22 Jul, 2009 om 13:26

    Het is jammer dat je dit niet terug ziet in de google webmastertools. Je ziet wel de duplicate titels maar niet de duplicate content. Wie weet komt dit nog in een nieuwe versie :-)

    Reageren
  • Dave zegt:
    22 Jul, 2009 om 13:55

    Zelf uitvoerig aan het testen met duplicate content op verschillende sites en geen enkel ‘probleem’ te bespeuren zolang titel en meta description niet hetzelfde zijn..

    Mijn voorlopige conclusie is dus dat er geen duplicate content probleem bestaat tussen verschillende domeinen.

    Intern zou inderdaad een probleem zijn maar ook daar wil ik wel eens op testen :o

    Reageren
    • Karel Geenen zegt:
      22 Jul, 2009 om 14:38

      Je bedoelt dus dat beide pagina’s worden weergegeven in de zoekresultaten? Lijkt me sterk…

    • Robert zegt:
      29 Jul, 2009 om 21:38

      Ik ben beniewd……

  • Dave zegt:
    22 Jul, 2009 om 14:55

    Sterk in zwaar werk maar toch is het zo..en G blijft ze wekelijks bezoeken.

    Meer nog, ik ken iemand die met duizenden pagina’s aan het testen is en allen staan in G’s index.

    Groot probleem in de SEO wereld is het feit dat alles ‘zomaar’ wordt aangenomen en er zelf nooit onderzoek wordt na gedaan. Als een grote naam zijn mond opendoet en zegt dat de sneeuw zwart is dan volgt 98% :o

    Reageren
  • Dave zegt:
    22 Jul, 2009 om 15:15

    Google is God niet :o Volgens hun kan je ook niet in de top 10 komen als je niet volgens hun regels speelt…

    Er zijn menige zeer compet. markten waar spammers al jaar en dag in de top 10 staan.

    Reageren
    • Karel Geenen zegt:
      22 Jul, 2009 om 15:18

      Wat wil je nu eigenlijk iedereen aanraden Dave? Om je niets van duplicate content aan te trekken?

  • Dave zegt:
    22 Jul, 2009 om 15:26

    Ik raad iedereen aan om G niet voor de voeten te lopen :o Dus als ze zeggen dat duplicate content ‘slecht’ is dan hou je dat beter in je achterhoofd…

    Maar ik zie nu wel dat ze niet echt in staat zijn om duplicate content op verschillende domeinen ‘af te straffen’…

    Reageren
  • Dries (SEO Optimizer bvba) zegt:
    22 Jul, 2009 om 15:27

    Wat wij hebben ervaren is het volgende :

    Duplicate content werd niet gestraft maar de ‘beste’ pagina die voldeed aan de zoekopdrachten voor de keywords werd opgenomen.. de rest wordt ook gecached maar deze pagina’s vonden wij niet terug in de eerste 100 resultaten. Verder zijn we niet gaan zoeken.

    Reageren
  • Carnaval in Nederland zegt:
    22 Jul, 2009 om 17:15

    Ik heb google al meerdere malen aangegeven via het abuse formulier dat een andere pagina meerdere pagina’s met content heeft gekopieerd maar die doen er helaas tot nu toe ook nog weinig mee. Iemand ervarind dat het abuse formulier ook echt zinnig is?

    Reageren
    • Jacob Ras zegt:
      23 Jul, 2009 om 13:57

      Welk abuse formulier heb je precies gebruikt?

  • Hans Keeren zegt:
    22 Jul, 2009 om 20:14

    Ik heb op dit weblog van Karelgeenen een artikel geschreven over 8 usabilityfouten. Dit artikel heb ik ook geplaatst op mijn eigen weblog http://www.qonvert.com.

    Van dit artikel zijn de titel en metadesription anders. Ook heb ik een paar woorden in de tekst aangepast. Echter, niet zoveel woorden.

    Geen van beide artikelen wordt geweerd uit de Google index.

    Ik ben geneigd om mij bij Dave aan te sluiten.

    Het artikel op Karelgeenen.nl staat wel hoger gëindexeerd ;-) Goed werk Karel

    Reageren
  • Dave zegt:
    22 Jul, 2009 om 23:25

    Alle pagina’s ranken. Wel nog even zeggen dat ze niet exact dezelfde keyword combinatie in het vizier hebben. Laten we zeggen dat als we voor artikel A de combo “Grote hondenmanden” nemen, dan nemen we voor de copy “Grote lederen honden manden”

    Voorlopig werkt het en ik denk ook niet dat Google daar gelijk iets kan aan doen. Natuurlijk dat ze zelf het omgekeerde vertellen, hoe zou je zelf zijn als je index overspoeld wordt met content :o

    Reageren
  • Daantjer zegt:
    23 Jul, 2009 om 11:34

    Maar hoe zit dat dan met affiliate progra
    mma’s? Daar wordt te pas en te onpas teksten overgenomen van webwinkels…..en zou meer omzet moeten genereren. Maar dat haalt dus op deze manier je eigen vindbaarheid naar beneden……??? Of zit ik er helemaal naast??

    Reageren
    • Karel Geenen zegt:
      23 Jul, 2009 om 11:56

      De originele publisher zal, mits deze als eerste is geïndexeerd, boven de anderen vertoond worden.

    • Dave zegt:
      23 Jul, 2009 om 12:45

      Ik merk dat de originele post niet perse boven de andere gaat ranken . Hangt vooral af van de ‘sterkte’ van de site en de inkomende links naar het betreffende artikel.

  • Jurgen zegt:
    23 Jul, 2009 om 13:35

    Ik volg Dave in zijn bevindingen. Zelf ben ik ook bezig met enkele blogs te maken met teksten die voor 80-85 % duplicate content zijn van andere sites. Waarom? Enkel om te testen als ik hoger kan ranken dan sites die al jaren over dit onderwerp schrijven en dus een streepje voor zouden moeten hebben bij Google. Als je de teksten optimaliseert, ook al is het maar door het gebruik van meer keywords, links tussen je eigen artikels,… kan je al een hele sprong maken in de zoekresultaten.

    Onderwerpen waar weinig concurrentie is, geven binnen enkele dagen al heel goede resultaten.

    Ik neem wel de moeite om een passende inleiding te schrijven met veel keywords, maar de rest van de tekst blijft nagenoeg onaangeroerd en dit heeft tot op heden (nog) geen gevolgen voor de Google zoekresultaten. Andere zoekmachines gebruik ik momenteel nog niet om te testen, dit laat ik dus even links liggen in mijn reactie.

    Reageren
  • Jongerenloket zegt:
    23 Jul, 2009 om 13:49

    Wij plaatsen heel veel gedupliceerd content en worden ook regelmatig benaderd om content (lees nieuwsartikelen) te plaatsen die ook al op de site van de organisatie staan.
    Bijv. samefeelings stuurde ons een nieuwbericht dat wij geplaatst hebben, waarschijnlijk zijn we niet de enige.

    Het is dus toch aan te raden om de Titel en H2 / H3 iets te veranderen, begrijp ik hieruit.

    Reageren
  • Jacob Ras zegt:
    23 Jul, 2009 om 14:04

    Ik heb zelf ook al enige tijd last van duplicate content, omdat een website van mij ( http://www.minisudoku.nl ) meerdere keren volledig is geript, en zelfs ter download werd aangeboden!

    Van de tot nu toe 11 gevonden kloons zijn er al 8 offline (gedwongen via email). En van de 24 download locaties is ongeveer driekwart offline.

    De oorzaak heb ik al gevonden, een Nederlander heeft mijn website geripped, in de footer geplaatst ‘Cloned by Torrentbay.nl’ en deze vervolgens naar meerdere download sites geupload. Daardoor denken sommigen dat het vrij te gebruiken is, en plaatsen ze het online.

    Ook vervelend is dat de hoster van de belangrijkste kloon (HostGator) vereist dat een DMCA (Digital Millennium Copyright Act) per fax wordt opgestuurd. Digitaal ondertekende email kan ook, maar tot nu toe werden al mijn emails teruggestuurd (omdat het niet digitaal ondertekend zou zijn, wat ze wel zijn).

    Reageren
  • Dries (SEO Optimizer bvba) zegt:
    23 Jul, 2009 om 14:24

    @Jacob al gerechtelijke stappen ondernomen ? Niet dat het veel zal uitmaken wss maar het schrikeffect kan wel iets opleveren.

    Reageren
    • Jacob Ras zegt:
      23 Jul, 2009 om 14:48

      Nee, de eigenaar van de belangrijkste kloon zit ergens in Azië. Ik denk dat eventuele gerechtelijke stappen me meer zullen kosten dan opleveren.

  • Jaap zegt:
    24 Jul, 2009 om 17:26

    Als er ergens veel duplicate content staat is het wel op een forum wat ik heb.
    Lezers plaatsen berichten uit de media waarover vervolgens gepraat wordt.
    Via Google worden we juist gevonden op het originele bericht.
    De plek waar het bericht vandaan komt scoort vaak enige resultaten lager.

    Mij mening is dus dat duplicate content op dit moment nog geen problemen oplevert.

    Reageren
  • Eduard Blacquière zegt:
    25 Jul, 2009 om 16:57

    @Dave
    Amen :)

    Er bestaat in mijn ervaring ook geen straf voor duplicate content.

    Maar vanuit user experience is het volkomen logisch dat Google en andere zoekmachines niet dezelfde of identieke content meerdere malen teruggeven in de zoekresultaten.

    Het is dus zaak dat je als de autoriteit wordt gezien. Met interne duplicate content kun je dit eenvoudig oplossen. Met externe content is het lastiger, maar zeker niet onmogelijk ;)

    Reageren
  • Tim Huijbers zegt:
    29 Jul, 2009 om 10:15

    Mooie discussie :)

    Ik durf eigenlijk nog geen kant te kiezen, al ben ik uit principe wel iemand die duplicate content liever ziet gaan dan komen.

    Voor de personen die info doorplaatsen zou ik liever zien dat ze een deel doorplaatsen en voor het hele artikel doorverwijzen naar de bron.

    Content is niet voor niets eigenlijk het grootste probleem voor een nieuwe website. Iedereen struikelt erover en wat is dan makkelijker om content te stelen ipv te maken.

    Bij product omschrijvingen is het gezien de hoeveelheid ook nog eens heel veel werk om dit aan te passen, maar zoals Karel zegt kan het dus wel een groot voordeel opleveren als je hier een copywriter z’n gang laat gaan.

    Reageren
  • Robert zegt:
    29 Jul, 2009 om 21:36

    Erg lastig ook met webshops e.d.
    Je krijgt vaak de product specs van de leverancier welke iedereen gebruikt. Alles herschrijven is ook erg moeilijk

    Reageren
  • Internetmarketing Isinet zegt:
    13 Aug, 2009 om 08:23

    Om duplicate content binnen je eigen site te achterhalen, kun je ook atijd een tool gebruiken zoals deze bijvoorbeeld: http://www.webconfs.com/similar-page-checker.php

    Reageren
  • Internetmarketing Isinet zegt:
    13 Aug, 2009 om 08:27

    Ik deel overigens de mening dat duplicate content een groter probleem vormt binnen de pagina’s van 1 site dan tussen verschillende sites. En eigenlijk is dat wel logisch ook.

    Reageren
  • Jacob Ras zegt:
    17 Sep, 2009 om 17:57

    Ik heb overigens nog een handige tip om automatisch een melding te krijgen van duplicate content: kopieer een stukje tekst van je website en maak hiervoor een Google Alert aan. Zo krijg je van Google een email als het stukje tekst ergens gevonden wordt.

    Reageren
  • Koen zegt:
    19 Dec, 2012 om 18:53

    Ik ben bezig met een jobsite te bouwen. Ik krijg van werkgevers vacature omschrijvingen toegestuurd die tevens al op hun site of op een andere jobsite staat. Logischerwijs wordt dit duplicate content. Toch wil ik graag dat Google de job detailpagina indexeert. Kan je ook een deel van de content uitschakelen (lees: de omschrijving van de job) op een pagina?

    Groet, Koen

    Reageren
  • Jannie zegt:
    05 Jul, 2013 om 20:02

    Iemand een idee hoe @Coolblue_NL duplicate content probleem met NL en BE domein oplost? Excact zelfde content. Of maakt Google onderscheid?

    Reageren
  • Roel zegt:
    17 Okt, 2014 om 17:00

    Wat ik niet zo goed begrijp aan externe duplicate content is het volgende:

    Wij hebben in onze webshop veel productomschrijvingen waarin de volgende zoekwoorden
    voorkomen.
    *productype
    *merk

    Nu zijn al deze productomschrijvingen overgenomen van andere sites. Is het nu zo dat alle productomschrijvingen niet meegeteld worden in de ranking van Google wanneer iemand een zoekopdracht doet? Ik begrijp dat daar juist deze discussie om gaat, alleen heb ik de indruk dat de externe duplicate discussie meer toegespitst is op nieuwsblogs.

    Reageren
    • Karel Geenen zegt:
      20 Okt, 2014 om 09:41

      Dag Roel,

      Externe duplicate content geldt niet alleen voor nieuwsblogs maar zeker ook voor webwinkels. Hier schuilt ook vaak het grote probleem, men kopieert de teksten van de leveranciers en verwachten dan te scoren op die producten.

      Dat werkt dus niet op die manier. Alleen wanneer je unieke content creëert én meerwaarde geeft voor de bezoekers met deze unieke content kun je pas hoog gaan scoren in Google.

  • @GrootkarzijnJ zegt:
    25 Nov, 2015 om 10:41

    Dag Karel,

    Erg benieuwd naar jou mening en antwoord!

    Wij zijn bezig met het maken van een webshop, alleen hebben we daarnaast al tijd lang een website die hoog in Google Geranked staat met vele pagina’s.

    Nu praten wij hier over wat we moeten doen, de webshop loskoppelen van de website, of juist de webshop in de website laten bouwen.

    Website staat naar mijn idee voor (uitgebreide)inhoudelijke informatie over onze producten en diensten, en de webshop kun je de desbetreffende producten bestellen.

    Wanneer wij de webshop loskoppelen van onze website, krijgen wij dan ook te maken met duplicate content? En wanneer wij net zoveel aandacht geven aan de webshop als bij de website, lopen deze elkaar dan niet in de weg?

    Daar bedoel ik dan mee te zeggen dat we twee verschillende klanten kennen, de ene klant wil graag veel informatie over onze producten en naar onze fysieke winkel komen, maar de andere wil eigenlijk gewoon direct producten bestellen via de shop!

    Ik kan me voorstellen dat mensen op de website komen, die producten willen kopen, dus die zijn verkeerd! Daarnaast geld het andersom idem dito, mensen die informatie willen hebben, komen op onze webshop maar die willen juist informatie.

    En wanneer we de webshop in onze website bouwen, ‘verplichten’ wij de online koper om eerst de informatie te lezen, voordat ze het product kunnen aanklikken.

    Of zit ik hier nu helemaal naast?

    Reageren

Reageren