Duplicate Content

Duplicate Content ist eine Begrifflichkeit aus dem Bereich der Suchmaschinenoptimierung (SEO). Die Art und Qualität des Contents einer Webseite trägt maßgeblich zum PageRank innerhalb der organischen Suche einer Suchmaschine bei. Da duplizierter oder gleicher Inhalt dem Konsumenten keinen Mehrwert bietet, wirkt er sich entsprechend negativ auf die Platzierung aus.

Definition

Der Begriff Duplicate Content (deutsch: doppelter Inhalt) bezeichnet identische Inhalte. Die Inhalte können sich sowohl innerhalb einer Webseite wiederholen oder auch über unterschiedliche URLs abgerufen werden. Dabei gelten neben vollkommen gleichen Inhalten auch Inhalte, die sich zu einem großen Teil gleichen, als Duplicate Content. Die Problematik liegt darin, dass sich die Indexierung gleicher Inhalte durch Suchmaschinen negativ auf die Platzierung der Webseite auf der Search Engine Result Page (SERP) auswirkt. Das Komplement zu doppeltem Content bilden einzigartige Inhalte, sogenannter Unique Content.

Interner und externer Duplicate Content

Duplicate Content kann sowohl intern als auch extern existieren. Interner doppelter Content kann dann ein Problem darstellen, wenn eine einzelne Seite über mehrere unterschiedliche URLs erreichbar ist. Auch die Optimierung der Seite in Hinblick auf die Darstellung in mobilen Browsern oder auf ein druckoptimiertes Layout kann dazu führen, dass Suchmaschinen den Content doppelt erfassen und ihn als Duplicate Content bewerten. Dementsprechend schlecht rankt die Seite in der organischen Suche. Externer Duplicate Content, der über unterschiedliche URLs abgerufen wird, kann beispielsweise im Rahmen einer Content-Kooperation vorkommen. Auch bei einem Domain-Umzug oder bei Webseiten mit verschiedenen Länderversionen kann es zu einer Dopplung des Contents kommen. Neben dieser rechtmäßigen Nutzung des duplizierten Contents kann es allerdings auch zu einer unrechtmäßigen Nutzung kommen, wenn Webseitenbetreiber Inhalte von anderen Webseiten kopieren ohne einen Verweis auf die Quelle einzubetten.

Problematik und Lösungsansätze

Suchmaschinen wie Google bewerten Duplicate Content ohne Quellenverweis immer als Betrugsversuch. Für die Identifizierung rechtmäßig oder unrechtmäßig genutzter doppelter Inhalte gibt es unterschiedliche Herangehensweisen. Im Rahmen der OnPage-Optimierung können Webseitenbetreiber Duplicate Content zum Beispiel durch die Eingabe bestimmter Textabschnitte oder prägnanter Sätze in die Suchmaske einer Suchmaschine wie Google ausfindig machen. Durch die Verwendung von Anführungszeichen wird nur nach exakten Übereinstimmungen gesucht. Gibt es dementsprechend noch andere Treffer als die eigene Webseite, kann von dupliziertem Content ausgegangen werden. Darüber hinaus gibt es eine Vielzahl nützlicher Tools wie Duplicate Content Checker, die sowohl externen als auch internen Duplicate Content identifizieren.

Für Online-Shops stellt Duplicate Content eine besondere Herausforderung dar. Werden Produktbeschreibungen vom Hersteller Wort für Wort übernommen oder ergeben Attribut-Filter übereinstimmende Produktlisten, wird dies als identischer Inhalt bewertet. Deshalb sollten besonders Online-Shops auf die individuelle Betextung ihrer Produkte auf der eigenen Seite, auf Drittseiten wie Preisvergleichsportalen und externen Shoppingportalen achten.

Um interne identische Inhalte zu vermeiden, bietet sich die Arbeit mit entsprechenden Weiterleitungen an. Auch durch das Versehen der Seiten mit einem noindex-Tag, kann die Indexierung von Seite mit identischen Inhalten unterbunden werden. Liegt eine Webseite in unterschiedliche Länderversionen vor, kann dies durch das Tag für Suchmaschinen kenntlich gemacht werden. Ähnliches gilt für den rel=alternate-Tag, der Seiten für mobile Browser kennzeichnet.

Durch unterschiedliche Anpassungen des Algorithmus sind Suchmaschinen wie Google heutzutage sehr gut in der Lage, Duplicate Content zu erkennen. Identifizieren Suchmaschinen und Crawler doppelte Inhalte, versuche sie den originalen Content ausfindig zu machen. Es findet nur eine Indexierung der Urheber-Seite statt; Webseiten mit dupliziertem Content werden nicht in den Ergebnissen der Suche gelistet. Nicht nur Duplicate Content, sondern auch Inhalte, die sich stark ähneln, sogenannter Near Duplicate Content, kann zu Problemen in Hinblick auf den PageRank führen.

Darüber hinaus gilt immer, dass die mehrfache Verwendung von Content unabhängig davon, ob es sich nur um einen Teaser oder einen umfassenden Text handelt, vermieden werden sollte. Unique Content wirkt sich in jedem Fall positiv auf den PageRank aus und leitet so mehr Traffic auf die eigene Webseite.

Einfluss auf SEO

Nutzt ein Konsument eine Suchmaschine, um eine bestimmte Information zu gelangen, versuchen Suchmaschinen, die gewünschten Informationen möglichst umfassend abzubilden. Da duplizierte Inhalte dem Nutzer keinen Mehrwert bieten, werden Webseiten mit duplizierten Inhalten nicht in der organischen Suche platziert. Kopieren Webseitenbetreiber Inhalte von anderen Domains ohne einen Verweis auf die Quelle zu hinterlegen, wird dies von Suchmaschinen als Manipulationsversuch bewertet und entsprechend abgestraft, indem die Webseiten auf den Indices der Suchmaschinen entfernt werden. Dementsprechend wird die Domain nicht mehr in den Suchergebnissen platziert und verliert maßgeblich an Traffic. Deshalb sollten Webseitenbetreiber duplizierten Content immer auch als solchen kennzeichnen und die Quelle mitführen.

In Falle internen duplizierten Contents können sich zudem Indexierungsprobleme ergeben. Für Suchmaschinen und Crawler sollte jederzeit ersichtlich sein, welche Seite mit ihrem Content den größten Mehrwert für die Suchanfrage des Nutzers bietet, um Schwankungen in der Platzierung auf der Ergebnisseite zu vermeiden. Auch Hinweise auf den originalen Inhalt helfen, Indexierungsprobleme zu vermeiden.