Naar
boven

Duplicate content: problemen en oplossingen | deel 2

In het eerste artikel zagen we dat je duplicate content op eigen domein zoveel mogelijk moet zien te vermijden. Ook duplicate content op twee of meer verschillende domeinen is niet wenselijk, met uitzondering van de situatie waarin je zelf een artikel schrijft voor je site, het vervolgens aanbiedt aan een andere site en Google het oorspronkelijke artikel op jouw site aanmerkt als het origineel.

In het tweede deel van deze serie leer je hoe je duplicate content kunt opsporen en oplossen.

Hoe spoor je duplicate content op?

Duplicate content kun je op de volgende manieren opsporen:

Google Webmaster Tools

Ga in Google Webmaster Tools (GWT) naar Uiterlijk van Site Search > HTML-verbeteringen. Hier kun je zien of Google dubbele meta descriptions en/of title tags is tegengekomen op je site, wat zou kunnen duiden op duplicate content op je domein.

Google

Als je wilt checken of er kopieën van je artikel elders op het web staan, kun je een stuk tekst uit je artikel kopiëren en tussen dubbele aanhalingstekens invoeren in Google.

Door dubbele aanhalingstekens te gebruiken zoekt Google naar plaatsen waar dat gehele blokje tekst in dezelfde volgorde op internet voorkomt.

Ben je op zoek naar duplicate content op je eigen domein, gebruik dan het “site:” commando. Dit commando kun je in combinatie met andere zoekcommando’s gebruiken.

Vermoed je bijvoorbeeld dat er meerdere kopieën van je homepage op je eigen domein voorkomen, zoek dan in Google op “site:mijnsite.nl intitle:”de titel van mijn homepage””.

Copyscape

Een handige manier om te controleren of jouw artikel zonder toestemming door een andere site is overgenomen is Copyscape. Voer eenvoudigweg de URL van de pagina die je wilt controleren in en Copyscape speurt het web af naar mogelijke duplicaten van je artikel.

Oplossingen voor duplicate content

Als je duplicate content tegen bent gekomen, is het zaak om het weer op te lossen. Hieronder lees je verschillende manieren waarop je dit kunt doen.

Kies de oplossing die voor jou het makkelijkst is en doe geen dingen dubbelop. Kies je bijvoorbeeld voor een 301-redirect, dan hoef je niet ook nog eens een canonical tag toe te passen.

1. Duplicate content verwijderen: 404

De eenvoudigste manier om met duplicate content om te gaan, is om het simpelweg te verwijderen. De verwijderde URL geeft dan een 404-code (pagina niet gevonden).

Heeft de oude pagina inkomende links en bezoekersverkeer? Kies dan voor een 301-redirect.

2. Een 301-redirect

Met een 301-redirect geef je aan dat de pagina permanent verplaatst is naar een andere locatie. Een gebruiker die de duplicaat-URL invoert in zijn browser, wordt dan automatisch doorgeleid naar de juiste URL.

Het voordeel van een 301-redirect is dat de linkjuice van de duplicaatpagina doorvloeit naar het origineel.

Gebruikers die de oude URL in hun favorieten hebben opgeslagen, worden vanzelf doorgeleid naar de nieuwe URL en krijgen geen 404-foutmelding.

Gebruik altijd een 301-redirect (permanent verplaatst) en geen 302-redirect (tijdelijk verplaatst). Een 302-redirect laat namelijk geen linkjuice doorvloeien.

3. Redirecten van http naar www

Om ervoor te zorgen dat alle pagina’s op je site toegankelijk zijn via één type URL, moet je een 301-redirect aanleggen van http naar www (of andersom). Als je website gehost wordt op een Apache server, kun je de 301-redirect maken door je .htaccess-bestand aan te passen.

Draait je site op een Microsoft IIS-server, dan maak je de nodige aanpassingen met behulp van de Internet Services Manager. Ga je hier liever niet zelf mee aan de slag, vraag dan je hostingprovider om de redirect voor je door te voeren.

Stel vervolgens ook in Google Webmaster Tools je voorkeursdomein in. Klik hiervoor in GWT op het tandwielpictogram en klik op Site-instellingen. Stel je hier bijvoorbeeld de www-versie als je voorkeursdomein in, dan beschouwt Google alle links die hij tegenkomt naar de http-versie van je site als een link naar de www-versie.

4. De canonical tag

Met gebruik van de canonical tag kun je Google laten weten wat je voorkeurs-URL is (ook wel canonieke URL genoemd).

Gebruik je zo’n canonical tag, dan geef je de linkjuice door net als bij een 301-redirect. Je kunt zoekmachines op de hoogte brengen van de canonieke pagina door een canonical tag toe te voegen aan het <head>-gedeelte van de niet-canonieke versie van de pagina.

Is je homepage bijvoorbeeld toegankelijk via de niet-canonieke URL http://www.mijnsite.nl/index.html, dan voeg je onderstaande code aan het-gedeelte van die pagina toe om Google te laten weten dat http://www.mijnsite.nl je voorkeurs-URL is:

Rel-canonical

5. Robots.txt en meta robots

Met een robots.txt-bestand in je root directory kun je zoekmachines laten weten welke pagina’s of folders ze wel en niet mogen crawlen. Als je duplicate content op een pagina en in een bepaalde folder hebt staan, blokkeer je die pagina en folder voor Googlebot door ze als volgt op te nemen in je robots.txt:

robots-txt

Je kunt dit ook op paginaniveau doen door een meta robots tag toe te voegen aan het-gedeelte van de pagina.

Je kunt kiezen voor een noindex, follow of noindex, nofollow. In beide gevallen wordt de pagina niet geïndexeerd, maar bij een follow-commando volgt de zoekmachine wel alle links die op de pagina staan in tegenstelling tot het nofollow-commando.

meta-robots

Google raadt overigens het gebruik van robots.txt af en adviseert liever een andere oplossing te gebruiken. Als Googlebot de geblokkeerde pagina’s met duplicate content niet kan crawlen, kan hij namelijk niet vaststellen dat die URL’s naar duplicate content verwijzen en beschouwt hij de geblokkeerde URL’s als unieke en afzonderlijke pagina’s.

6. URL verwijderen in Google Webmaster Tools

Om een URL handmatig uit de index van Google te laten verwijderen, ga je in GWT naar Google-index > URL’s verwijderen.

Voordat je een verzoek tot verwijdering aanvraagt, moet je eerst de pagina verwijderen zodat ze een 404-code geeft en/of de pagina blokkeren met robots.txt of een robots noindex metatag.

7. URL-parameters blokkeren in Google Webmaster Tools

In GWT kun je bepaalde URL-parameters instellen, zodat Google alle URL’s die die parameters bevatten negeert en niet in de index opneemt.

Dit kan bijvoorbeeld handig zijn als je site URL’s met sessie-id’s gebruikt, die allemaal naar dezelfde content verwijzen. Om dit in te stellen ga je in GWT naar Crawlen > URL-parameters.

8. Plagiaat aanpakken

Heeft een andere site content van jouw site zonder toestemming overgenomen? Neem dan contact op met de host of webmaster van die site en verzoek om verwijdering van de content. Als dit niet helpt, kun je bij Google een verwijderingsverzoek indienen.

Tot nog toe hebben gekeken naar wat duplicate content is en hoe je het kunt opsporen en oplossen. In het volgende en tevens laatste deel van deze artikelserie geef ik je nog wat praktische tips en adviezen om duplicate content te vermijden.

>>> Lees hier deel 3 van deze reeks! <<<

Meer leren over zoekmachine optimalisatie? Klik hier voor onze gratis e-mailcursus!

Met onze hulp bovenaan in Google?

Bekijk onze cursus zoekmachine optimalisatie, onze dienst of vul onderstaand formulier in:


Over de auteur:

Dit artikel is geschreven door .

Michiel Brand
Michiel Brand is tekstschrijver en SEO-specialist. Met sterke SEO-webcontent maakt hij websites beter vindbaar in zoekmachines en zorgt hij voor hogere conversie.
20 reacties op "Duplicate content: problemen en oplossingen | deel 2"
  • HJ zegt:
    06 Mei, 2014 om 19:50

    Bedankt Michiel voor het delen van deze tips… Ga ik zeker wat aan hebben !!

    Reageren
    • Michiel Brand zegt:
      07 Mei, 2014 om 11:54

      Fijn dat je er wat aan hebt HJ! In het laatste artikel in deze serie geef ik nog wat praktische tips om duplicate content te vermijden.

  • Marian Janssen zegt:
    07 Mei, 2014 om 11:27

    Goed artikel waar ik wat mee kan. Ik ben erachter gekomen dat iemand mijn hele site onderhand gekopieerd heeft. Heb diverse mails gestuurd maar ze ontkent alles en zegt dat ik alles gekopieerd heb. Wat doe je hier dan nog aan???

    Reageren
    • Michiel Brand zegt:
      07 Mei, 2014 om 11:59

      Dat is een vervelende situatie Marian. Je kunt controleren of Google jouw site als origineel aanmerkt door te zoeken op bepaalde steekwoorden in je site en te kijken of jouw site als eerste getoond wordt. Als de andere site wordt getoond in plaats van die van jou en de webmaster weigert de content te verwijderen, kun je bij Google een verwijderingsverzoek indienen wegens het schenden van auteursrecht. Het formulier daarvoor vind je hier: https://www.google.com/webmasters/tools/dmca-notice?pli=1&&rd=1.

  • Aartjan van Erkel zegt:
    07 Mei, 2014 om 12:12

    Goede tips Michiel, bedankt.

    Hoe kijk jij aan tegen gastartikelen op grote blogs? Ik schrijf een paar keer per jaar een artikel voor Marketingfacts of Frankwatching, en plaats dat door op mijn blog. De titels van de artikelen maak ik verschillend en de tekst is op mijn blog ook iets uitgebreider meestal, maar voor het grootste deel is het artikel gelijk.

    Ik beschouw het artikel op MF of FW als het origineel, dat gaat ook als eerste live. Een uurtje later zet ik het dan ook live op mijn eigen blog. Er staat geen verwijzing via een canonical URL van mijn blog naar MF of FW of vice versa.

    Doe ik nu iets heel stoms door deze duplicate content op internet te zetten of valt het wel mee? Hoe zit het met de vindbaarheid, ik vind het op zich geen probleem als in dit geval het artikel op MF of FW beter gevonden wordt dan het artikel op mijn blog.

    Reageren
    • Michiel Brand zegt:
      07 Mei, 2014 om 13:06

      Dank voor je reactie Aartjan. Het plaatsen van duplicate content op verschillende domeinen komt vaker voor en is op zich niet zo erg. Alleen als een site (vrijwel) geheel uit duplicate content bestaat, kan Google een penalty uitdelen, maar daar is hier natuurlijk geen sprake van.

      De vindbaarheid binnen zoekmachines is wel een issue. Als Google twee dezelfde artikelen tegenkomt op verschillende domeinen, zal hij in beginsel alleen het artikel tonen in de zoekresultaten dat hij als origineel beschouwt. Om te beoordelen welke pagina het origineel is, kijkt Google onder andere naar het tijdstip van indexatie, maar als die vlak na elkaar liggen wordt dat lastig. Google kijkt verder ook naar canonical tags en eventuele links terug naar het originele artikel.

      In dit geval zou het zeker kunnen gebeuren dat Google het artikel op jouw site ziet als origineel en dat op MF of FW als duplicaat. Sommige sites die gastblogs plaatsen hebben hier geen probleem mee, maar andere weer wel en stellen bijvoorbeeld als voorwaarde dat gastblogs niet elders geplaatst mogen worden. Voor de zekerheid zou ik dus even checken hoe de site die het artikel plaatst hiertegen aankijkt.

  • Karel Geenen zegt:
    07 Mei, 2014 om 13:12

    Ik weet niet hoe Michiel hier over denkt, maar ik denk er het volgende van:

    Ik zou werken met een canonical in dit geval. Je zult er neit zozeer voor gestraft worden door Google, maar het is in principe wel duplicate content. Het heeft vanuit Google gezien geen meerwaarde dat beide artikelen gevonden worden. En al helemaal niet met verschillende zoekwoorden maar met dezelfde inhoud (door een andere titel zou dit namelijk wel kunnen). Een canonical adviseer ik in ieder geval in een dergelijke situatie.

    Je bent overigens ook van harte welkom om hier bij ons een paar blogs achter te laten ;).

    Reageren
    • Michiel Brand zegt:
      07 Mei, 2014 om 13:43

      Als de site die het gastblog plaatst er bezwaar tegen heeft dat het artikel op hun site mogelijk niet als origineel wordt gezien, valt het inderdaad altijd op te lossen met een canonical tag. Een andere optie is een robots noindex-metatag op de duplicaatpagina zetten (maar een canonical is m.i. de beste optie).

  • Ine klein zegt:
    07 Mei, 2014 om 18:26

    Ik heb een gids database website, nu geeft hulpprogramma voor webmaster an dat de urls hieronder een dubbele tille tag hebben. Dat is heel vreemd want er is maar 1 pagina businesses.php die elke keer een ander id weergeeft (afhankelijk van de zoek aktie van de bezoekers)
    ondertussen zijn er ongeveer 150 verschillende ids.
    (150 verschillende categorien dus)

    MAAR WAAROM GEEFT HET HULPPROGRMMA ALLEEN DEZE ONDERSTE 6 LINKS AAN ALS DUBBELE TITLE TAGS ?

    Fethiye business guide – Travel & Holiday guide – companies
    /EN/businesses.php?id=Blackpoint%20Fethiye%20Perfumum
    /EN/businesses.php?id=G%C3%B6cek%20%C3%96zel%20Marina%20-%20Exclusive
    /EN/businesses.php?id=Soyupak
    /EN/businesses.php?id=Ye%C5%9Fil%20Vadi%20Do%C4%9Fa%20Park
    /NL/businesses.php?id=Faralya%20Arthouse
    /NL/businesses.php?id=Turkuaz%20Poliklini%C4%9Fi

    Reageren
    • Michiel Brand zegt:
      07 Mei, 2014 om 20:39

      Google bekijkt niet per se alle verschillende varianten van dezelfde pagina onder verschillende id’s. Dit levert wel duplicate content op en het is raadzaam dit op te lossen. Een mogelijkheid is om in GWT URL-parameters in te stellen, zodat Google alle URL’s met die parameters negeert. Om dit in te stellen ga je in GWT naar Crawlen > URL-parameters.

  • Aartjan van Erkel zegt:
    08 Mei, 2014 om 09:52

    Bedankt voor jullie deskundige antwoord Michiel en Karel. Ik concludeer dat er geen man overboord is dat ik het zo doe.

    Reageren
    • Michiel Brand zegt:
      08 Mei, 2014 om 12:21

      Inderdaad geen man overboord Aartjan. Voor de zekerheid zou ik wel even checken bij de site die het gastblog plaatst wat hun beleid hierin is. Sommige sites stellen als voorwaarde dat gastblogs nergens anders geplaatst mogen worden of ze staan het wel toe, maar dan met gebruik van een canonical tag. Andere sites malen weer niet om vindbaarheid in zoekmachines van gastartikelen en gaat het gewoon om goede content.

  • Ine Klein zegt:
    08 Mei, 2014 om 10:27

    dus alle url die je daar invult worden genegeerd? ZE waarschuwen om deze toepassing te gebruiken. Het vreemde is dt alleen deze 6 urls ais dubbele meTA WORDEN gezien. Dus de links die als dubb. worden gezien knip en plak ik in GWT? Kan je misschien iets beter beschrijven? Heb er geen ervaring mee

    Reageren
    • Michiel Brand zegt:
      08 Mei, 2014 om 12:27

      GWT toont niet per se alle URL’s op je site met dubbele meta’s. Als het er heel veel zijn, gaat Googlebot ze namelijk niet allemaal crawlen.

      Het gebruik van de URL-parametertool kan inderdaad tricky zijn: je moet goed weten wat je doet. Dit kun je dan ook het beste laten doen door je webmaster of iemand met voldoende technische kennis. Het gevaar is namelijk dat je parameters toevoegt, waardoor ook URL’s worden uitgesloten, die je nu juist wel geïndexeerd wilt hebben.

      Op deze pagina vind je een goede uitleg van Google over URL-parameters: https://support.google.com/webmasters/answer/1235687?hl=nl

  • Martijn vd Beek zegt:
    03 Jun, 2014 om 20:10

    Bedankt voor dit artikel! Ik had even bewaard om er de juiste aandacht aan te schenken.

    Hoe serieus moet je in GWT de HTML-verbeteringen
    Dubbele beschrijvingen in “meta”-tags nemen?

    Volgens GWT ben ik behoorlijk aan het dubbelen. Als ik de aangegeven pagina’s bekijk op de website en in de Google resultaten is alles uniek.Toch krijg ik deze melding dat de meta tags een dubbele vermelding bevatten. Ook deze zijn allemaal handmatig aangepast.

    Ben benieuwd!

    Reageren
    • Michiel Brand zegt:
      03 Jun, 2014 om 20:28

      GWT registreert de dubbele meta’s bij het crawlen. Als je ze allemaal handmatig hebt gecheckt en aangepast, heb je geen dubbele meta’s meer op de site. Het duurt enige tijd voordat Google dit ook opmerkt. Als het goed is, verdwijnen de dubbele meta’s dus vanzelf uit GWT na verloop van tijd!

  • Martijn vd Beek zegt:
    03 Jun, 2014 om 22:31

    Pfff…

    Bedankt!

    Reageren
  • Ruben Harms zegt:
    24 Apr, 2015 om 15:19

    Hoi Karel,

    Mooi artikel, dank daarvoor! Ik zie trouwens dat de tekst “>>> Lees hier deel 3 van deze reeks! <<<" niet linkt naar de pagina waar die heen moet! Iets om te fixen denk ik :-)

    Groeten,

    Ruben

    Reageren
    • Coen van den Brand zegt:
      27 Apr, 2015 om 11:59

      Dag Ruben,

      Bedankt voor het melden. Ik heb het direct aangepast.

  • sander zegt:
    20 Okt, 2015 om 09:34

    Ik heb de hosting bij transip. Er bestaat al een .htacces bestand. Wat moet ik er in zetten om alles Door te laten verwijzen? Is er geen plugin voor wordpress beschikbaar?

    Ik ben bang dat ik bepaalde instellingen verkloot en mijn website niet meer bereikbaar is. Mvg Sander

    Reageren

Reageren