Sonstiges

Google Indizierungsmechanismus und sprechende URLs

irgendwie ist dat immer schlimmer: Juli 2004 haben wir auf WordPress umgestellt und nicht mehr die typischen URLs von Movable Type wie zB abc.de/blog/1234.html, sondern abc.de/blog/ich-bin-ein-toller-link.php. Ergebnis: Google findet zwar immer besser MEX mit immer mehr Begriffen – was meines Erachtens auf die stete Verlinkung von Drittseiten zurückzuführen ist -, doch verweist auf völlig andere URLs, nämlich die Kategorieseiten, Linkseiten, etc… nur nicht direkt auf den betreffenden Artikel. Beispiel anhand eines sehr frischen Artikels über defekte TDSL-Modems >>. Folgt dem MEX Blog Link… und wo landet man? Nein, nicht im Artikel selbst, sondern auf der Linkliste >>. Klar, da ist der Artikel rechterhand noch zu erkennen, aber bald nicht mehr.

Schrott! Habt Ihr ähnliche Erfahrungen oder sind das nur temporäre Effekte, die durch die typische Startseitendarstellung mehrerer Artikel untereinander entstehen, später aber Google den passenden Artikel korrekt indiziert?

Über den Autor

Robert Basic

Robert Basic ist Namensgeber und Gründer von BASIC thinking und hat die Seite 2009 abgegeben. Von 2004 bis 2009 hat er über 12.000 Artikel hier veröffentlicht.

9 Kommentare

  • Ich kenne weder WordPress en détail noch die Struktur Eurer Site, um genau sagen zu koennen, was Ihr machen koennt.

    Abstrakt sind zwei Wege gehbar:

    1. In der Datei robots.txt fuer alle Suchmaschinen oder nur den Robot von Google alle Dateien, die nicht in den Datenbestand der Suchmaschine aufgenommen werden sollen, ausschliessen. Wenn sich darunter auch Seiten sind wie Startseiten, Sitemaps usw., deren internen Links zwar verfolgt werden sollen, die aber selbst nicht indiziert werden sollen, bleibt nur die zweite Methode:

    2. Als Metatag in alle Seiten, deren internen Links robots zwar folgen, die aber selbst nicht indiziert werden sollen, eintragen:
    Es reicht aber auch , da follow unterstellt wird.

    Die 1. Methode ist insoweit vorteilhafter und sollte deshalb, soweit es geht, eingesetzt werden, weil es dann den Robots erspart wird, die gesperrten Dateien anzufordern. Bei der 2. Methode muss hingegen die Datei, die nicht indiziert werden soll, abgerufen und analysiert werden, was Traffiv verursacht, der mit der 1. Methode vermieden wird. Robots schauen naemlich in der Regel erstmals in der robots.txt nach, ob dort Anweisungen fuer Sie aufgeschrieben sind.

    Siehe dazu z.B.:
    http://www.bjoernsworld.de/suchmaschinen/robots-txt.html

    Ob man mit WordPress unterschiedlichen Dateien (etwa der Startseite einerseits, den Seiten mit den einzelnen Postings andererseits) unterschiedliche Metatags zuordnen kann, weiss ich nicht…

    Das von Dir angesprochene Problem stellt sich meines Erachtens aber meist auch gar nicht, weil die Seiten mit den einzelnen Postings bei der Suche mit Suchwortkombinationen in der Regel von Google besser platziert werden sollten als eine Startseite, bei der diese Suchwortkombinationen weniger spezfisch sind. Moeglicherweise handelt es sich deshalb um ein voruebergehendes Problem, das daraus resultieren koennte, dass Google die Startseite moeglicherweise haeufiger und damit schneller indiziert als die Folgeseiten.

  • mW kann ich nicht bei WordPress 1.2 differenzierte Header mitgeben. Das geht schon eher mit WordPress 1.5, zB über if Abfragen, um welchen Seiten-Typ es sich handelt.

    Ganz herzlichen Dank für die hilfreichen Infos 🙂

  • Wenn du rasch auf diesen
    http://www.google.de/search?q=+site:www.m-e-x.de+%22Unser+Tipp+mit+dem+F%C3%
    B6n+und+dem+TDSL+Modem+scheint+zu+wirken.
    +Es+gibt+aber+auch+noch+andere+Methoden:+%
    22&hl=de&lr=&c2coff=1&filter=0″ klickst, wirst du sehen, dass dein genannter Beitrag noch zu jung und gar nicht von Google erfasst ist. 😉

    Dazu muss man wissen, wie der Google-Robot arbeitet. Er fängt oben auf der Seite, z. B. mex/blog, an, arbeitet die Seite zeilenweise ab und folgt den Links auf der Seite, und zwar in der Reihenfolge, in der die Links auf der html-Seite erscheinen. Und die ersten Links sind bei dir die Verlinkungen zu „Links“ und Archiv“. Je weiter oben die Detaillinks stehen, desto eher werden die Beiträge von Google erfasst.

    Um das zu erreichen, habe ich oben in meiner html-Seite zuerst die sogenannten „recent posts“ (die 5 neuesten) verlinkt. Dann folgen bei mir wegen der Aktualität die „recent comments“.

    Abgesehen davon stimme ich dir zu! Es erscheinen oft Kategorieseiten bei den Suchergebnissen. Oft enthalten gerade diese die Suchbegriffe, fachlich gehaltvoll sind sie aber oftmals nicht. Um dieses zu vermeiden, müsste man wiederum die Übersichtsseiten für die Google-Robots über die Meta-Tags ausschließen.

    Sprechende URL sind eine gute Sache. Suchmaschinen durchsuchehn auch sie nach Suchbegriffen. Google macht es jedenfalls.

  • Sorry für meine teils doppelten Ausführungen. Meinen Kommentar hatte ich geschrieben, als ich die beiden ersten Kommentare noch nicht gelesen hatte.

  • habs jetzt testhalber in den Content Bereich, gefällt mir da besser und müsste eigentlich auch indiziert werden. Gefällt Dir das besser im Content oder links in der Sidebar?

  • Besser aussehen tuts im Contentbereich. Da du aber die linke Navi im html-Quellcode zuerst stehen hast, ist die Platzierung in der linken Navi aus Suchmaschinensicht geschickter. Oder du vertauscht die Div’s „Content“ und „Menu“ im html-Quellcode und machst die kleine Anpassung in der CSS-Datei. 😉