Canonical Tag und Noindex Tag niemals zusammen nutzen

John Müller sagte neulich: „Nutze niemals einen Canonical-Tag von Seite X zu einer indexierbaren Seite Y, wenn auf der Seite X ein noindex Tag ist. Ich würde eines der beiden Tags nutzen, aber nicht beide!“ John Müller. Und jetzt weiß ich warum!

Canonical-Tag und Noindex-Tag niemals zusammen nutzen

Das Problem mit dem Canonical Tag und Noindex Tag auf einer Seite

Wenn man Google sagt, Seite X soll nicht in den Index, dann markiert man diese mit einem noindex robots Tag.

Fall 1: Wenn aber auf der selben Seite X dann ein selbstreferenzierender Canonical Tag enthalten ist, also ein Canonical auf sich selbst, also ein Canonical auf eine noindex Seite, dann macht das keinen Sinn.

Fall 2: „Der Canonical-Tag gibt eigentlich an, dass beide Seiten identisch sind. Die mit noindex markierte Seite gibt an, dass die Seite nicht indexiert werden darf. Die Frage für Google: Dürfen dann beide Seiten nicht indexiert werden?“ John Müller

verwirre Google nicht!

Es ist dann so, als teile man Google mit, nehme für die noindex Seite X eine Alternative Seite. In diesem Fall wieder X und die ist ja auf noindex. Das ist ein Widerspruch in sich und Google ist verwirrt. Man darf nie vergessen, dass Google immer noch eine Maschine ist. Eine Maschine kann nicht logisch denken und wird extrem verwirrt, sobald man von der vorgegeben Norm abweicht. Soweit die Theorie.

Proof: Wird eine noindex Seite indexiert, wenn Sie einen Canonical auf sich selbst hat?

Jain. Es kann halt vorkommen! Muss aber nicht. Kurzum, keiner weiß dann mehr, was die Maschine daraus macht. Ich habe gerade eine von mehreren URLs gefunden, die einen noindex Tag hat, aber der Canonical auf sich selbst verweist. Diese URL ist im Index, obwohl sie einen noindex Tag hat! Dank des Canonicals wird also der Robots-Tag völlig ignoriert!

Hier ist deutlich zu erkennen, dass die URL einen robots Noindex Tag hat
noindex-canonical

Und hier deutlich zu erkennen, dass diese URL dennoch im Index ist!
noindex-canonical-index

Learnings aus dem Beispiel

  • Selbstreferenzierte Canonicals und Robots noindex Tag zusammen zu nutzen ist nicht nur Blödsinn, sondern sogar „gefährlich“, da das noindex oder der Canonical komplett ignoriert werden könnte.
  • Wenn man einer noindex Seite ein anderes Canonical gibt, dann kann es passieren, dass der noindex bis zur referenzierten indexierbaren Seite durchgereicht wird und dafür sorgt, dass auch diese aus dem Index fliegt. Jens Fauldrath und John Müller
  • Wenn die URL nicht in den Index soll, es aber ein anderes Original dazu gibt (Duplicate Content), dann das noindex einfach weglassen und per canonical zum Original verlinken.
  • Wenn die URL kein Duplicate Content erzeugt (also kein anderes Original hat) und dennoch nicht in den Index soll, Canonical weglassen und ein noindex setzen.
  • Wenn die URL auf index steht, dann sollte der Canonical Tag niemals auf eine andere Seite zeigen als sich selbst. Ob ein Meta Robots index Eintrag existiert oder gar kein Robots Eintrag existiert ist gleich. Ein nicht existenter Robots-Tag bedeutet index.

Mein Fazit zum Canonical Tag und Robots Index Tag in Kombination

Ich ziehe den folgenden Schluss aus der Geschichte:

Canonical-Tag und Noindex-Tag niemals zusammen nutzen

  • Laut Google sollte ein Canonical nur dann gesetzt werden, wenn die URL des Canonical Links eine andere ist, als die aufgerufene. Also nur dann, wenn Duplicate Content vermieden werden soll. („Including a rel=canonical link in your webpage is a strong hint to search engines your about preferred version to index among duplicate pages on the web.“ Google Webmaster Blog)
  • Ein Canonical darf nicht gesetzt werden, wenn ein Noindex Robots Tag gesetzt ist. Google weiß dann nicht, ob das Noindex für die URL oder auch für die canonisierte URL gilt. Hier wird beides ignoriert oder schlimemr noch, die referenzierte Seite aus dem Index genommen.
  • Vice Versa: Ein Robots noindex Tag darf nur dann gesetzt werden, wenn kein Canonical gesetzt ist (diese Einsicht ist die Umkehrung des vorherigen Punktes)
  • Ein Canonical hat Prio vor dem Robots Index oder Noindex Tag, denn ohne Duplicate Content kein Canonical Link notwendig. Noindex ist dann individuell nach der Intention des Beitrags zu wählen. Das ist eine Folgerung, die nicht bewiesen werden kann.

Nachtrag 9.6.15 – WordPress Plugin wpSEO macht das für euch bereits richtig

Wie es scheint, liefert das SEO-Plugin wpSEO in der aktuellen Version bereits eine Möglichkeit des geforderten Prozedere. Sobald ein Noindex Tag gesetzt wird, wird das Canonical entfernt.

Screenshot 2015-06-11 um 22.13.40

Diese Beitrag stellt nur meine Beobachtung und eine Kuration verschiedener Quellen zum Thema Canonical Tag und Robots Tag. Keine Gewehr für Richtigkeit. Fehlaussagen möglich. Solltest Du es besser wissen, dann wäre ich Dir sehr dankbar, wenn Du eine nicht korrekte Aussage im Kommentar richtig stellen würdest.

Dieser Beitrag wurde hierher importiert. Das Datum der Veröffentlichung war 1.6.15. Die Inhalte stimmen aber auch heute noch.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.