Dem Google die Feeds verbieten

Immer öfter stolpere ich in den Google Results über Ergebnisse die direkt auf einen Feed zeigen. Das passiert lustigerweise primär (zumindest subjektiv) bei Wordress-Blogs. Dabei lässt sich da eigentlich recht einfach Abhilfe schaffen. Via Robots.txt lassen sich (zumindest die braven SE-Bots) von den Feeds fernhalten:


User-agent: *
Disallow: /*feed/*
User-agent: googlebot
Disallow: /*feed/*

Das gilt so für alle Feeds die über feed/in der URL erreichbar sind. In meinem Blog trifft das auf alle Feeds (inkl. Artikelbezogene Kommentarfeeds zu). Ich wusste bisher auch nicht, dass Wildcards in dieser Form in der robots.txt erlaubt sind. Der Google-Checker (Webmaster Tools) hat jedoch sein okay dazu gegeben, also nehm ich das mal so hin und werde es ab sofort so einsetzen.

Wer will, darf’s natürlich gerne mitnehmen ;)
Für die bösen Roboter gibt’s übrigens SpiderTrap. Das kommt hier gleich aus der Nachbarschaft und wirkt bei mir seit Monaten recht gut gegen BlutContentsauger. Unbedingt mal ausprobieren.

Ähnliche Beiträge

  • Trigami will Blogger bezahlen

    In den USA wurde vor wenigen Wochen ReviewMe gegründet. Das Konzept (Blogger werden von Unternehmen für Produktreviews im eigenen Blog bezahlt) sorgte in der deutschen Blogosphäre – wie immer wenn’s um’s Geld geht – für heisse Diskussionen. Es war auch schnell klar, dass man als deutscher Blogger bei ReviewMe erstmal nicht punkten können wird. Nun…

  • Sevenload’s Technik

    Björn von ThinkPHP hat kürzlich ein Interview mit Thomas Bachem geführt. Thomas ist Chief Software Architect beim Videoportal sevenload.de. Thomas nennt darin interessante technische Details. Was mich persönlich am meisten überrascht hat, ist die Tatsache, dass Sevenload nach wie vor und (so wohl die Absicht) auch langfristig auf PHP und mySQL setzt. Was auch auffällt…

  • Counterstrike ist schuld

    Ach du meine Güte. Nun sind wir wieder so weit. Der Amokläufer von Emsdetten war ein bekennender Counterstrike-Spieler. Nun haben wir die Diskussion über die Zulässigkeit von „PC-Killerspielen“ wieder auf dem Tisch. Kapiert denn endlich mal noch jemand, dass das Problem nicht die Ego-Shooter sind, sondern vielmehr das kaputte soziale Umfeld des Täters? Wenn diese…

  • Gemeinschaftsprojekt OpenSource

    Vor ein paar Tagen habe ich ja hier schon mal von meinem Plan eines Gemeinschaftsblogs zum Thema OpenSource gesprochen. Das ganze nimmt langsam Formen an. Das Design ist zu ca 50% fertig, das Logo ist im Entwurfsstadium auch schon drin (wird noch leicht verändert) und auch das Blog ist installiert. Wie das Logo schon verrärt…

8 Kommentare

  1. Das dürfte aber auch die (wenigen) Feedreader treffen die sich an die robots.txt halten. Aber das dürften eh so in etwa 0 sein ;-)

  2. Ja. Ich hab das mit den Feeds bei mir im Blog schon etwas länger. Soweit funktioniert das auch ganz gut.
    Nun wollte ich vor kurzem mal die Bilder (die eh nicht mehr vorhanden sind) aus dem Index entfernen. Und da meinte Google das Wildcards in der robots.txt nicht erlaubt seien.

    Ich finde es auch sehr merkwürdig, da Google auf seinen eigenen Seiten behauptet mit Wildcards könnte man verschiedenen Bild-Typen von der Indexierung ausschließen (z.B. mit /*.gif)

  3. Pingback: Blog » WordPress Plugin: NoIndex Feed » Frank Helmschrott

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert