Google Sitemaps Verification 404-Problem

oder: wie man mal schnell eine Stunde verplempern kann.

Ich bin gerade dabei eine neue WordPress-Installation für ein Projekt aufzusetzen. Neben einigen anderen Plugins gehört mittlerweile WP-Cache zum Standard. Mit WP-Cache werden statische Kopien von WordPress-Inhalten (Beiträge, Seiten, Archiv-Seiten, etc.) angelegt. Dies erspart beim steigendem Traffic einiges an Serverbelastung und funktioniert recht zuverlässig.

Nach der Installation der Standard-Dinge erfolgt auch irgendwann die Eintragung der Seite bei den Google Webmaster-Tools und die Anmeldung der Sitemap. Dafür ist bei Google die Verifikation der Domain nötig. Dadurch weiß Google, dass die Domain auch wirklich mir gehört. Selbige funktioniert durch hochladen einer Datei (googleda3424521342345….html) oder durch Änderung der Meta-Tags. Ich verwende immer die Datei-methode und lasse die Datei anschließend auch liegen, da Google in Regelmässigen Abständen diese Prüfung wiederholt. Beim heutigen Versuch den neuen Blog bei Google unterzukriegen, erhielt ich immer wieder die Fehlermeldung, dass meine Website nicht gefundene Unterseiten mit dem Code 200 anstatt Code 404 (File not Found) zurückgeben würde.

Das Problem ist mit WordPress kein neues, wie sich bei Google schnell zeigte. Offenbar sind zahlreiche Themes für WordPress nicht ordentlich gestaltet was ein ordnungsgemäße Rückmeldung des 404-nicht-gefunden codes im HTTP-Header verhindert. Ich habe also die meisten der zahlreichen Fixes ausprobiert und immer wieder mit einem Headerviewer die Rückgabe des Headers geprüft. Teilweise wurde mir dann im Browser korrekt der 404-Header zurückgegeben (war in den Logiles des Webservers ersichtlich), die Header-Prüfung und Google konnten allerdings nicht zufrieden gestellt werden.

Letzlich hat sich WP-Cache als Verursacher des Problems herausgestellt. Offenbar wird die korrekte Rückgabe des Headers bei nicht gefundenen Seiten damit verhindert. Ich habe es nun einfach zur Bestätigung der Domain kurz deaktiviert. So richtig zufriedenstellend ist das allerdings nicht, da Google bei erneuten Prüfungen wohl wieder auf das selbe Problem stoßen wird. Mit anderen Domains hatte ich jedoch bisher keine Probleme und hoffe, dass sich das ganze nun erledigt hat.

[tags]google,wordpress,sitemaps,webmaster tools,wp-cache,plugins[/tags]

Google Webmastertools mit neuen Bot-Funktionen

Google legt mal wieder zu. Aus den Sitemaps wurden vor geraumer Zeit ja die Webmaster Tools mit diversen weiteren Möglichkeiten für den wohlgesinnten Webmaster.

Ab sofort gibt es dort noch weitere nützliche Funktionen. Unter anderem hat Google die Tools um weitere Crawlingstatistiken erweitert. Diese geben genauer Aufschluss über die Botaktivitäten auf der eigenen Seite. Weiterhin kann der Bot nun über das Menü bzgl. seiner Aktivität gesteuert werden. Zwischen „Slower“, „Normal“ und „Faster“ darf der Webmaster nun die Spider-Greschwindigkeit des Robots wählen. Auch die Bildersuche verspricht Google über den Google Image Labeler zu verbessern. Der soll es Webmastern ermöglichen die eigenen Bilder besser erfassen zu lassen.

Leider kann ich über all das nur in der Theorie berichten, die die neuen Funktionen zumindest in meinem Tools-Account noch nicht zur Verfügung stehen.

Weitere Details gibt’s im Official Google Webmaster Central Blog.

[tags]google, webmaster central,sitemaps, webmaster tools, blog,image search, bildersuche, statistik[/tags]