Von Saskia Huber publiziert am 8. Februar 2017

Duplicate Content – Teil 2: Ursachen, Prävention und Behandlung

Duplicate Content ist zwar ein oft unterschätztes, aber nicht ein unlösbares Problem. Die Ursachen von Duplicate Content sind vielseitig – genauso die Möglichkeiten der Prävention und Behandlung. Wir möchten Ihnen die gängigsten Problemverursacher und, wie Sie diese beheben können, vorstellen.

Externer Duplicate Content

Als externer Duplicate Content werden Inhalte bezeichnet, die in gänzlich oder fast übereinstimmender Form auf mehreren verschiedenen Domains auftreten. Externer Duplicate Content ist also das, was die meisten intuitiv unter Doppelten Inhalten verstehen.

Ursachen, Prävention und Behandlung

Die Ursachen für externen Duplicate Content sind einerseits die rechtmäßige sowie die unrechtmäßige Publikation von Inhalten ohne korrekte Quellenangabe. Im Rahmen von Content-Kooperationen kommt es beispielsweise zu zulässigen Veröffentlichungen von Inhalten auf verschiedenen Domains. Um Duplicate Content in diesem Fall zu verhindern, sollten Sie entweder auf Kooperationen verzichten oder intensiv mit den Webseitenverantwortlichen zusammenarbeiten, denn es ist wichtig, dass alle Beteiligten auf korrekte Quellenangaben achten. Finden Sie Ihre Inhalte ohne korrekte Quellenangabe auf einer Seite, mit der Sie nicht kooperieren, ist es ratsam, mit dem entsprechenden Webseitenverantwortlichen in Kontakt zu treten. Diesen sollten Sie bitten, auf Ihre Seite als Quelle akkurat hinzuweisen oder den Inhalt zu entfernen.

Eine einwandfreie Quellenangabe im Quelltext sieht wie folgt aus:

 


<blockquote>Hier steht der zitierte Text - <cite>Hier steht der Name des zitierten Autors oder der Quelle</cite></blockquote>

 

 

Andererseits kann externer Duplicate Content auch aufgrund eines Domain-Umzuges oder aus der Nutzung verschiedener Länderversionen resultieren. Sind zum Beispiel alle Inhalte auf den Seiten Ihrer alten sowie auf den Seiten Ihrer neuen Domain verfügbar, haben Sie Duplicate Content geschaffen. Um dieses Problem zu beheben, ist eine anhaltende und serverseitige Weiterleitung mit 301 Redirect per .htaccess nötig. Mit 301 Redirect per .htaccess kann neben einer ganzen Domain auch eine einzelne URL umgeleitet werden. Das Ranking wird dabei jeweils auf die neue Seite übertragen.

Weiterleiten einer Domain über htaccess

RedirectPermanent / https://neuetollehuete.de

 

Weiterleiten einer URL über htaccess

RedirectPermanent /alterotehuete.html https://neuetollehuete.de/neuerotehuete.html 

Wenn Sie diverse Versionen Ihrer Webseite für verschiedene Länder erstellt haben, ist es wichtig, diese korrekt zu kennzeichnen, da ansonsten die identischen Inhalte auf den verschiedenen Länderversionen als externer Duplicate Content gewertet werden könnten. Das kann mit dem Alternate/Hreflang Tag bewerkstelligt werden: 


<link rel="alternate" hreflang="de" href="http://www.neuetollehuete.de/blauehuete" />
<link rel="alternate" hreflang="en" href="http://www.neuetollehuete.com/blauehuete" />

Verwechseln Sie Länderversionen jedoch nicht mit Sprachversionen einer Webseite. Sprachversionen werden von Suchmaschinen eigentlich nicht als Duplicate Content gewertet. Möchten Sie aber auf Nummer sichergehen und die einzelnen Sprachversionen als solche für die Suchmaschine kennzeichnen, verwenden Sie wiederrum den Alternate/Hreflang Tag.  

 

Interner Duplicate Content

Inhalte, die in identischer oder sehr ähnlicher Form auf unterschiedlichen Seiten einer Domain zu finden sind, werden interner Duplicate Content genannt. 

Ursachen, Prävention und Behandlung von Internem duplicate Content

Die Ursachen für internen Duplicate Content entpuppen sich als vielseitig – oft sind sie technischer Natur. 

Im Folgenden werden wir auf sieben mögliche Ursachen für internen Duplicate Content eingehen und erläutern, wie Sie Doppelte Inhalte auf Ihrer Domain verhindern oder beheben können: 

Eine der Seiten Ihrer Webseite ist über mehr als eine URL zugänglich? Das ist der Fall, wenn eine entsprechende Seite beispielsweise mit und ohne www, mit http und mit https oder mir wie ohne / am Ende der URL erreicht werden kann. Google bewertet das als Duplicate Content.

Um das zu verhindern oder zu beheben ist ein ModRewrite Eintrag in der .htaccess Datei (301 Redirect), also eine Domainumleitung nötig. Diese leitet beispielsweise die Domain ohne www auf die Domain mit www um:

 

RewriteEngine on

RewriteCond %{HTTP_HOST} ^neuetollehuete.de

RewriteRule ^(.*)$ https://neuetollehuete.de$1 [R=301,L]

 

In URLs sollte nur die Kleinschreibung verwendet werden. Nutzen Sie Gross- und Kleinbuchstaben gefährden Sie eine mehrfache Indexierung und damit die Bewertung Ihrer Inhalte als Duplicate Content.

Bieten Sie Ihren Nutzern die Möglichkeit, Seiteninhalte über eine druckoptimierte Version oder ein PDF-Dokument einer oder mehrerer Seiten auszudrucken, findet Google diese natürlich und stuft sie möglicherweise als Duplicate Content ein. Um das abzuwenden, kann ein Canonical Tag verwendet werden. Der rel=canonical Tag zeigt Google auf, welche der URLs die wichtigste ist, also welche bevorzugt wird:

 

 

<head>
...
<link rel="canonical" href="https://neuetollehuete.de/gruenehuete" />
...
</head>


 

Eine andere Ursache für internen Duplicate Content sind beispielsweise Produkte, die in mehreren Kategorien eingeordnet ist und damit über verschiedene URLs erreihbar ist. Auch hier wird dann ein canonical Tag eingesetzt, von dem auf die wichtigste Seite verwiesen wird.

Sie haben sich nicht für eine responsive, sondern für eine auf mobile Endgeräte ausgerichtete Seite entschieden, die neben Ihrer regulären Webseite besteht? So tritt derselbe Fall ein, wie bei druckoptimierten Versionen Ihrer Seiten. Wiederum können Sie mit dem Tag rel=canonical, die zu bevorzugende Seite für Suchmaschinen ausweisen und auf diese Weise die Einstufung Ihrer Inhalte als Duplicate Content abwehren oder beheben.

Um die Herkunft und das Verhalten von Usern auf einer Webseite zu tracken, werden häufig URL-Parameter und Session-IDs benutzt. Für Suchmaschinen wie Google entstehen dadurch unterschiedliche URLs mit demselben Inhalt. Das bedeutet natürlich Duplicate Content. Es gibt hier zwei Varianten, die dieses Problem lösen: entweder Sie platzieren die Tracking-Parameter in Cookies oder verweisen im canonical Tag auf die gleiche URL ohne Aufführung von Parametern. 

Ab einer bestimmten Anzahl Kommentare auf einer Seite wird von einigen CMS eine neue Seite für Kommentare erstellt. Die Kommentare werden also auf unterschiedliche Seiten aufgeteilt, was für die Suchmaschine in neuen URLs resultiert (www.neuetollehüte.de/gelbehüte/comments1 und www.neuetollehüte.de/gelbehüte/comments2). Ein Weg, Google mitzuteilen, dass es sich hierbei nicht um Duplicate Content handelt, ist das Hinterlassen eines noindex, follow Hinweises in den META Tags der nicht zu indixierenden Seite

 

<META Name=“robots“ CONTENT=“noindex,follow“>


 

Durch die Nutzung des noindex Tags wird die Seite von Google zwar nicht mehr indexiert, dank des follow Tags wird sie jedoch weiterhin durch die Suchmaschine gecrawlt. 

In Zusammenhang zu internem Duplicate Content werden auch oft paginierte Seiten genannt. Das ist zwar nicht vollkommen korrekt, da paginierte Unterseiten zwar nie 1:1 identisch sind, trotzdem  können diese Seiten mit Tags markiert werden, um den Suchmaschinen den Zusammenhang zwischen den einzelnen Seiten zu signalisieren. Das geschieht über folgenden Tag:

 

<link rel="prev" href="https://www.neuetollehuete.de/gruenehuete.html" />
<link rel="next" href="https://www.neuetollehuete.de/gruenehuete-3.html" />



  

Befindet man sich auf der Seite /gruenehuete-2.html, signalisiert der obige Tag im Head den Suchmaschinen die vorhergehende und folgende URL in der Paginierung. Die Suchmaschine kann so einen direkten Zusammenhang zwischen den URLs herstellen und begreift alle folgenden Seiten als Erweiterung der Seite /gruenehuete. 

Extra-Tipps

Tipp 1:
Seien Sie stets kreativ! Nehmen Sie sich Zeit, einzigartige und interessante Inhalte zu kreieren und vermeiden Sie es, Content von anderen Seiten zu übernehmen oder Ihre Textbausteine mehrfach zu verwenden, ohne diese korrekt zu kennzeichnen. 

Tipp 2:

Eine tolle Möglichkeit, sich kostenfrei einen Überblick über die Indexierung Ihrer Webseite zu verschaffen, bieten die Webmaster Tools von Google (Google Search Console). Die Tools ermöglichen es Ihnen, Duplicate Content Probleme Ihrer Webseite aufzuspüren und zu lösen. 

Wie Sie nun selbst sehen konnten, gibt es viele Duplicate-Content-Ursachen und Bekämpfungsmöglichkeiten. Neben normalen Webseiten können gerade Online-Shops an den Folgen von Duplicate Content leiden. Das Problem wird aber oft nicht als wichtig erachtet, obwohl für Web-Shops neben den oben genannten Ursachen noch weitere bestehen können. Im nächsten Blogbeitrag werden wir aus diesem Grund spezifisch auf die Duplicate Content Probleme bei Online-Shops eingehen.