Was ist Duplicate Content?
Duplicate Content ist Inhalt, der im Internet auf mehr als einer Seite gefunden wird, also unter mehreren URLS aufrufbar ist.
Warum ist Duplicate Content schlecht?
Für Suchmaschinen ist es schwer zu unterscheiden, welcher Inhalt besser zur aktuellen Suchanfrage passt. Gibt es mehrere Seiten mit gleichem oder sehr ähnlichem Inhalt, wird Google nicht alle diese Seiten anzeigen, sondern versuchen herauszufinden, welche davon die Originalversion ist und daher die höchste Relevanz besitzt. Das kann zu einer Verschlechterung der Rankings dieser Seiten führen: Alle Seiten mit doppelten Inhalten teilen sich die Relevanz und verlieren an Bedeutung.
Sobald der Google Bot auf eine Seite kommt, wird diese normal indexiert. Wenn die Inhalte nur auf der eigenen Seite mehrfach vorkommen, wird versucht herauszufinden, ob es sich dabei um Spam handelt oder z.B. um notwendige rechtliche Angaben in einem Webshop, die sich wiederholen. Im letzteren Fall passiert nichts Negatives. Sollte der Inhalt allerdings von einer anderen Seite wissentlich übernommen worden sein, oder mehrere Seiten mit Spam-Inhalt erstellt worden sein, beeinflusst das das Ranking negativ.
Folgende Arten von Duplicate Content werden unterschieden:
Doppelter Inhalt kann intern, also durch die eigene Website oder extern, durch eine fremde Website, entstehen.
Einige häufige Verursacher für internen duplicate content:
- URL Parameter: Verschiedene Parameter für Klick Tracking, Analytics Codes und ähnliches, die an die URL angehängt werden, können doppelten Inhalt verursachen.
- Session IDs sind ein häufiger Verursacher von doppelten Inhalten. Das passiert, wenn jeder User, der eine Website besucht, eine eigene Session ID zugeteilt bekommt, die in der URL sichtbar ist.
- Druckerfreundliche Versionen der Website, wenn sie indexiert werden.
- Wenn die Seite mit www und ohne erreichbar ist, mit http und https oder über unterschiedliche Domains (z.B eigene Mobile Seiten).
- Nach einem Domain Umzug, wenn die alte Seite noch indexiert ist.
- Unterschiedliche Länderversionen in der selben Sprache, die nicht korrekt ausgezeichnet sind.
- Veraltete SEO Strategien, wie z.B. eine eigene Seite für jeden Bezirk der Stadt, auf denen jeweils die idente Dienstleistung angeboten wird.
Zu externem duplicate content kann es kommen, wenn Onlineshop Betreiber die Artikeleigenschaften direkt von der Herstellerseite kopieren oder ganz allgemein wenn Inhalte von anderen Seiten kopiert werden.
Wie finde ich heraus, ob ich auf meiner Seite ein duplicate content Problem habe?
Eine gutes und kostenloses Tool, um auf duplicate content zu überprüfen ist www.siteliner.com. Hier wird festgestellt, ob auf der eigenen Website Inhalte wiederholt vorkommen.
Die Lösung
Es gibt verschiedene Möglichkeiten Seiten mit gleichen Inhalt so auszuzeichnen, dass sie keinen negativen Einfluss auf das Ranking haben.
- 301 Redirect über .htaccess: Ein 301 Redirect, eine permanente Weiterleitung, führt von der doppelten Seite (mehrere Domains für die selbe Seite) zur Original Seite. So gibt es keinen Ranking Wettkampf zwischen den Seiten, es entsteht eine bessere Relevanz. Das wirkt sich positiv auf die Rankings aus.
- Rel=“canonical“: Ein anderer Weg ist die Lösung über das Rel=“canonical“ Tag. Dadurch wird dieselbe Meng an Link-Juice weitergegeben, wie bei einem 301 Redirect und ist oft einfacher einzubauen. Dieser Tag kommt in den Head Bereich einer Seite und zeigt den Suchmaschinen, dass diese Seite eine Kopie der Originalseite ist und alle Links und Inhaltlichen Metriken nur für die original URL gelten. Es wird auch empfohlen die Original Seite mittels canonical Tag auf sich selbst zeigen zu lassen.
- Noindex, follow: Diese Tags können auf Seiten eingebaut werden, welche nicht in den Suchmaschinenindex aufgenommen werden sollen. Dadurch kann der Suchmaschinenbot die Links dieser Seite crawlen, aber er indexiert diese Seite nicht und daher wird kein duplicate content erzeugt.
- ModRewrite: Über den Befehl „ModRewrite“ in der .htaccess kann z.B. bestimmt werden, dass die Domain nur mehr mit www oder nur mehr ohne aufrufbar ist.
- Sprach- und Länderversionen: Im Header der Seite wird die Sprachversion mittel hreflang=“x“ ausgezeichnet, sie ist somit eindeutig erkennbar und verursacht keinen duplicate content.
Bezüglich externen duplicate content kann eigentlich nur eines gesagt werden: Fremde Inhalte nicht von anderen Seiten zu „übernehmen“ und für seine eigenen auszugeben, versteht sich von selbst.
Man sieht also für alle Arten des duplicate content gibt es passende Lösungen, um das eigene Ranking wieder zu verbessern.