Duplicate Content: Was ist das und wie kann Duplicate Content identifiziert und behoben werden?

16. Juli 2020

letzte Aktualisierung:

15. Juni 2024

| Beitrag von

Stephan Czysch

Zu den Lieblingswörtern jedes SEOs gehört „Duplicate Content„. Doch was versteht man unter diesem Schreckgespenst jedes Webmasters und wie wirkt sich Duplicate Content, also doppelte Inhalte, aus?

Inhalt

1 Was ist Duplicate Content?
2 Duplicate Content identifizieren
3 Duplicate Content über unterschiedliche, eigene Domains hinweg
4 Warum ist Duplicate Content problematisch?

Was ist Duplicate Content?

Von Duplicate Content, abgekürzt mit DC, wird gesprochen, wenn exakt derselbe oder auch ein sehr ähnlicher Inhalt („Near Duplicate Content„) unter verschiedenen Webadressen hinweg zur Verfügung steht. Dies kann entweder domainintern sein oder über Domaingrenzen hinweg. Bei letzterem Fall muss zwischen eigenen Domains und fremden Domains unterschieden werden.

Duplicate Content identifizieren

Um doppelte Inhalte zu identifizieren, können folgende Strategien angewendet werden:

Google Suche mit dem gesuchten Textschnippsel in Anführungszeichen (z.B. „ist dieser Text mehrfach in Verwendung“)
Verwendung von Tools wie www.copyscape.com
Crawling der eigenen Website

Duplicate Content über die Google-Suche finden

Mittels des „“ Suchoperators kann nach exakten Textfragmenten gesucht werden. Gegebenenfalls sollte der site:domain.de-Befehl verwendet werden, um nur auf der eigenen Seite nach den zwischen den Anführungszeichen stehenden Worten zu suchen.

Im Beispiel ist alles gut: Der Text zu Michael Kors Taschen wurde nicht nur auf der Zielseite von peek-cloppenburg.de, sondern auch auf weiteren Domains gefunden.

Duplicate Content mit Copyscape finden

Mittels des Tools Copyscape (www.copyscape.com) kann im Netz nach Dokumenten gesucht werden, die dem übergebenen Dokument gleichen. Natürlich gibt es noch weitere Tools wie z.B. www.plagiarismchecker.co.

Doppelte Inhalte über ein Crawling der eigenen Website finden

Mit Crawlern kann die eigene Webseite untersucht werden. Gegebenenfalls lassen sich durch die Crawlingergebnisse Seiten identifizieren, die sich (intern) ähneln. Der einfachste Weg ist auch hier die Betrachtung doppelter Seitenelemente wie dem Seitentitel oder h1 Überschriften.

Doppelte Inhalte mit einem Website-Crawler finden

Duplicate Content über unterschiedliche, eigene Domains hinweg

Angenommen, man verwendet dieselben Inhalte für unterschiedliche Domains, die auf verschiedene Zielmärkte (z.B. Deutschland und Österreich) ausgerichtet sind, ist dank des HTML-Tags ‚rel=“alternate“ hreflang=““‚ eine Umgehung von möglichen Duplicate Content Problemen gewährleistet. Mehr zu diesem Tag ist im Google-Blog zu finden.

Warum ist Duplicate Content problematisch?

Für Nutzer erhöht sich der Mehrwert nicht, wenn identische oder nahezu identische Inhalte im Netz gefunden werden können. Selbes gilt für Suchmaschinen, die zudem kein Interesse daran haben, exakt identische Informationen als Top-Suchtreffer zu platzieren.

Das Hauptproblem von Duplicate Content liegt darin, dass sich Rankingsignale auf verschiedene Adressen verteilen. So senden mehrere Adressen dieselben inhaltlichen Relevanzsignale und Suchmaschinen müssen entscheiden, welches dieser Dokumente die relevanteste Version ist.
Stephan Czysch

Anstatt rankingrelevante Signale, allen voran Verlinkungen, auf verschiedenen Adressen zu verteilen, sollen diese besser auf genau einer Adresse zusammengefasst werden. Das ist über eine Weiterleitung oder Löschung der Varianten möglich, oder über deren Zusammenfassung auf eine Variante per Canonical-Tag.

Diese Artikel dürften dich auch interessieren