Duplicate Content: Der böse doppelte Inhalt

  • 9. November 2016
  • Blog
No Comments

Dublicate Content ist böse
Content-Marketing ist gegenwärtig in der SEO-Welt in aller Munde. Gute Inhalte haben ein gewaltiges SEO-Ranking-Potenzial bei Google und schaffen eine starke Relevanz. Deswegen haben sich viele SEO-Experten dem Schaffen von kreativen und vor allem einzigartigen Inhalten verschrieben. Einzigartig ist dabei das Stichwort. Denn Google und Co. bewerten Webseiten mit einzigartigem Inhalt (Content) viel besser, als Seiten mit abgeschriebenen oder umgeformten Texten.

Kreativität und Einfallsreichtum sind der Schlüssel zum Erfolg bei Google. In diesem Zusammenhang hört man immer wieder dieses böse Wort “Duplicate Content”. Viele Website-Betreiber wissen gar nicht, was damit gemeint ist und wie man sich gegen diesen bösartigen Virus sinnvoll schützen kann. Dem Phänomen “Duplicate Content” wollen wir deshalb auf den Grund gehen. Was ist Duplicate-Content eigentlich? Wie entsteht dieser doppelte Inhalt? Was kann man dagegen tun? Wie beeinflusst er meine SEO-Optimierung bei Google und Co.?

 

Was ist Duplicate Content?

Suchmaschinen wollen ihren Nutzern die bestmöglichen Inhalte bieten. Wenn eine Suchmaschine dieser Aufgabe nicht nachkommen kann, dann wird diese für die User unbrauchbar. Bestmöglicher Inhalt heißt jedoch auch “unique content”. Identische Texte werden somit von Google und Co. kategorisch ausgeschlossen.

Denn die Server der Suchmaschinen-Anbieter besitzen nur eine begrenzte Kapazität. Sollte ein Dokument also als nicht relevant eingestuft werden, da es “Duplicate Content” besitzt, wird es auch nicht in den Index bei Google und co. aufgenommen. Um zu verstehen, was “Duplicate Content” ist, sollten wir zuerst klären, was eigentlich “Unique Content” ist.

Dies ist ein einzigartiger Inhalt, der von Menschen geschrieben wurde und so wie er ist, an keiner anderen Stelle im Internet gefunden werden kann. Diese Texte werden meist von Redakteuren in Zusammenarbeit mit SEO-Experten sehr aufwendig produziert und bieten beste Ranking-Potenziale. Sollte ein Text diesen Maßstäben nicht genügen und mit einem anderen Dokument sehr ähnlich sein, dann spricht man von “Duplicate Content”

 

Duplicate Content ist nicht gleich Duplicate Content!

Doch es gibt verschiedene Abstufungen von Duplicate Content. Echter Duplicate Content besteht dann, wenn der Inhalt eines Dokuments zu 100% identisch ist. Dies betrifft nicht nur den Text, sondern auch Bilder und den Quelltext. Daneben gibt auch sehr ähnlichen Content, der ebenfalls einzigartig angesehen wird. Dieser entsteht, wenn zwei Dokumente in einigen Bereichen beinahe identisch sind. Dies könnten andere HTML/CSS-Layouts, ein getauschter Absatz oder eine veränderte Textstruktur sein. Auch wenn alle anderen Inhalte verschieden sind, aber der Text identisch, handelt es sich ebenso um Duplicate Content. Deshalb sollte sich vor allem der Text immer von anderen in einem großem Maße unterscheiden.

 

Wie wird der Duplicate Content eigentlich festgestellt?

Suchmaschinen wie Google oder Bing haben in den letzten Jahren ihre Erkennungsalgorithmen in Bezug auf Duplicate Content verfeinert. Offizielle Veröffentlichungen zur exakten Suche gibt es allerdings nicht. Doch es existieren durch Beobachtungen und SEO-Tests verschiedene Hinweise, wie die Suchmaschinen identische Inhalte erkennen:

 

1. Zu wieviel Prozent sind die Inhalte gleich?

Es gibt in der Praxis keine genauen Angaben darüber, wieviel Prozent des Textes doppelt sein müssen, um als Duplicate Content eingestuft zu werden. Sicher ist jedoch, dass man durch einfaches Umstellen von Textpassagen oder auch nur geringes Umschreiben des Textes die Dubletten-Erkennung nicht umgehen kann. Es sollten in jedem Fall 60% bis 70% des Textes einzigartig sein. Hierzu zählen auch title-tag und meta-description.

 

2. Doppelte URL

Wenn sich identische Textelemente auf unterschiedlichen URLs innerhalb einer Domain befinden oder über verschiedene Domains verteilt sind, dann wird dies als Duplicate Content gewertet.

 

3. Identische Strukturelemente

Viele Website-Betreiber verwenden gleiche Elemente auf ihren Seiten, wie ein identisches Impressum oder eine ähnliche Navigation. Google und Co. können mit Hilfe des HTML-Quelltextes sehr gut erkennen, wenn Strukturelemente identisch sind. Wenn eine Seite nur kopiert wird, ohne neue echte Inhalte zu bieten, dann wird dies ebenfalls als Double-Content eingestuft.

 

4. Erkennung des originalen Dokuments

Um Duplicate-Content aufzuspüren vergleichen die Suchalgorithmen die originale Website mit der kopierten. Die originale Website wird durch verschiedene Faktoren ausfindig gemacht. Hierzu vergleicht das Programm zuerst das Indexierungsdatum, also der Zeitpunkt der Indexierung und nicht der der Veröffentlichung. Ein weiterer Aspekt ist Trust. Eine Seite die viel Relevanz besitzt und weit oben in den Ranking-Plätzen auftritt, wird als Ursprungsdokument eingestuft. Zudem sind eingehende Quellverweise von anderen Seiten ein Indikator für einzigartige Inhalte.
Originales Dokument wurde gefunden

 

5. Shingle-Algorithmus

Um den Text auch wirklich auf Einzigartigkeit zu überprüfen, verwendet Google den Shingle-Algorithmus. Hierbei wird der Text einer URL erst mal analysiert. Dieser wird dann von Elementen wie Kommata, Punkten, Bindestrichen, Absätzen und Überschriften bereinigt. Sie erhalten dann einen Satz wie diesen hier.

„Goethe war einer der bedeutendsten Dichter unserer Zeit“

Nun setzt das Shingle-Verfahren ein. Unter Shingle versteht man ein Fenster, mit einer bestimmten Anzahl an Wörtern. In diesem Beispiel sieht man einen 3-Shingle. Nach diesem Prinzip wird dann der Satz so gegliedert:

Goethe war einer

war einer der

einer der bedeutendsten

der bedeutendsten Dichter

Dichter unserer Zeit

Nun wurde der Text in Dreierketten zerlegt. In einem ähnlichen Text auf einer anderen URL würde der identische Inhalt sofort bemerkt werden, selbst wenn man den Anfang und das Ende des Satzes vertauschen würde. Aus diesem Verfahren wird auch ersichtlich, wieso das Vertauschen von Absätzen und Textpassagen immer noch als Double-Content gewertet werden würde.

 

Bestrafungen wegen Duplicate Content

Wenn Google und Co. eine Seite als Dublette brandmarken, dann kann es zu weitreichenden Abstrafungen der Domain kommen. Harmlose Varianten wären erstere Benachrichtigungen mit Einbußen von 5-10 Plätzen. Eine etwas härtere Maßnahme wäre das Verschieben der Domain in den Supplemental Index. Dies ist ein Index zweiter Klasse und Seiten die sich darin befinden, werden nicht mehr auf der ersten Seite angezeigt.

Die Seite kann bei starken Duplicate Content jedoch auch komplett im Index verschwinden. Zudem leidet die Aktualisierung Ihrer Inhalte darunter. Da eine identische Website keinen Wert besitzt, aber das Crawling- und Indexierungskontingent eingeschränkt ist, verschwenden sie mit ähnlichen Seiten wertvolle Ressourcen. Unter diesen gebrandmarkten Seiten leidet natürlich auch der Linkjuice und der Trust-Faktor der Domain.

Seit dem Panda-Update 2011 hat sich vor allem Google auf das Auffinden von identischem Inhalt fokusiert. Demnach sind nun einzigartige title-tags und meta-descriptions viel wichtiger für das Ranking-Potenzial als früher. Deshalb sollte man immer darauf achten, dass alle Unterseiten verschiedene title-tag und meta-descriptions bekommen.

 

Wie vermeide ich Duplicate Content?

Diese Abstrafungen können jedoch vermieden werden, wenn man einige Dinge beachtet. Kopieren oder veröffentlichen Sie auf keinen Fall, mehrfach die gleichen Inhalte. Begehen Sie nicht den Fehler einen deutschen Text ins Englische zu übersetzen und dann wieder zurück. Die Strukturen bleiben erhalten.

Vermeiden Sie die gleiche URL mit und ohne www ins Netz zu stellen. Prüfen Sie regelmäßig, am besten über die Google-Webmaster-Tools, ob Sie eine Nachricht von Google, wegen Fehlern auf der Website, erhalten haben.

In wenigen Fällen kann es sich dabei um Duplicate-Content handeln. Überprüfen Sie ihre title-tag und meta-description auf identische Inhalte. Sehen Sie sich aber auch den Text Ihrer Seiten an. Durch das Setzen von Operatoren “Gänsefüßchen” im Suchfenster von Google und Co. kann oft leicht festgestellt werden, ob sich bei einem Satz um Duplicate-Content handelt. Ein Beispiel wäre:

„Goethe war einer der bedeutendsten Dichter unserer Zeit“

Wenn Sie diesen Text genauso eingeben haben und als Suchergebnis nur ein Treffer angezeigt wird, dann handelt es sich um einen einzigartigen Inhalt. Die Erkennung von Duplicate-Content ist aber immer noch nicht richtig ausgereift. Oft findet man bei den verschiedensten Online-Magazinen den gleichen Artikel, egal welche Website man bei den ersten zehn Plätzen aufruft.

Hier muss Google einfach noch besser optimiert werden.

Wer schreibt hier eigentlich?

Wir sind ein Experten-Team in der digitalen Welt und stehen für eine nachhaltige Optimierung.

Kostenlose Beratung

Wir sind ein professionelles Team und unterstützen Sie folgenden Bereichen: Suchmaschinenoptimierung (SEO) , Suchmaschinenmarketing (SEA) , Content-Marketing , Social-Media und Web-Design.

Andere Leser interessierte besonders