Duplicate Content

Duplicate Content (DC) ist der Fachbegriff für im Netz hinterlegte Inhalte, die komplett oder weitgehend identisch sind. Duplicate Content entsteht, wenn der gleiche Inhalt mit unterschiedlichen Quelladressen (URL) im Netz abgerufen werden kann. Für doppelte Inhalte kann es interne oder externe Ursachen geben. Duplicate Content führt dazu, dass die entsprechenden Seiten z.B. von Google im Ranking abgewertet, im bestimmten Fällen sogar indiziert oder abgemahnt werden. Ein wesentliches Ziel der Suchmaschinenoptimierung (SEO) ist es, doppelte Inhalte zu vermeiden.

Duplicate Content im Kontext der Suchmaschinen

Die Qualität einer Suchmaschine besteht darin, zu einer Suchanfrage die jeweils relevantesten Ergebnisse zu listen. In den frühen Zeiten von Internet und Suchmaschinen wurde die – bewusste – Dopplung von Inhalten nicht selten als probates Mittel genutzt, um die Präsenz und „Sichtbarkeit“ im Netz zu vergrößern. Diese Zeiten sind längst vorbei. Doppelte oder ähnliche Inhalte werden von den Suchmaschinen per Algorithmus so weit möglich identifiziert und herausgefiltert. Der durch doppelte Inhalte verursachte „Crawl-Aufwand“ für die Suchmaschine ist erheblich. Durch entsprechende Anpassung ihrer Algorithmen „wehren“ sich Suchmaschinenbetreiber wie Google gegen den zusätzlichen Aufwand, der durch Duplicate Content entsteht. Der Druck auf Websitebetreiber zur Vermeidung doppelter Inhalte wird dadurch erhöht.

Wie entsteht Duplicate Content – und wie kann er vermieden werden?

Interner Duplicate Content entsteht häufig durch nachlässige oder unvollständige Programmierung einer Website. Dies geschieht in der Regel unabsichtlich oder vielleicht sogar in bester strategischer Absicht. Z.B. werden Seiten intern verlinkt, um Kunden oder Lesern verschiedene Zugangswege zu Inhalten zu eröffnen, eine Website kann mit unterschiedlichen URLs aufgerufen werden (z.B. mit oder ohne www) oder beim Umzug einer Domain sind die gleichen Inhalte sowohl unter der alten wie unter der neuen Adresse abrufbar.

Durch entsprechende Hinweise in der HTML-Programmierung (entweder durch rel=nofollow Anweisung oder durch Meta-Tags) kann kenntlich gemacht werden, dass es sich um doppelte Inhalte handelt, die nicht bei der Ermittlung der Linkpopularität berücksichtigt werden sollen. Auch bei externer Verlinkung kann auf diese Weise Duplicate Content vermieden werden, ohne auf die Möglichkeit zur Schaffung von Synergien – z.B. zur Erhöhung der Besucherfrequenz oder zur Generierung von Klick-Zahlen – zu verzichten.

Vermeidung von Duplicate Content durch hochwertige, eigene Inhalte

Die Vermeidung von Duplicate Content ist immer auch eine Frage der Positionierung und des eigenen Anspruchs an das Content-Management. Online-Shops vermarkten in der Regel Produkte, die zu einer bestimmten Kategorie oder Reihe gehören. Um doppelte Inhalte zu umgehen, ist es wichtig, jede Produktseite mit eigenen Inhalten zu versehen, die für den Leser einen Mehrwert bieten und von der Suchmaschine als spezifischer Content erkannt werden können. Eine potenzielle Fehlerquelle sind hier z.B. Kategorietexte, die sich unverändert auf unterschiedlichen Seiten wiederfinden.

Die banalste Form von identischem Content entsteht durch das Kopieren von Textbausteinen anderer Websites oder Blogs, die unverändert auf der eigenen Seite verwendet werden. Diese Vorgehensweise ist nicht nur suchmaschinenfeindlich, sondern auch Betrug am Leser und an den Betreibern der plagiierten Websites. Allerdings ist das Zitieren einzelner Textbausteine im Rahmen eines eigenständigen Artikels natürlich erlaubt und wird von Google & Co. nicht geahndet, wie auch Matt Cutts in nachfolgendem Video nochmal betont:

Um Duplicate Content im World Wide Web aufzuspüren, existieren spezialisierte Tools, z. B. das kostenpflichtige Tool copyscape.com.

 

abgelegt unter: