Dem Google die Feeds verbieten

Immer öfter stolpere ich in den Google Results über Ergebnisse die direkt auf einen Feed zeigen. Das passiert lustigerweise primär (zumindest subjektiv) bei Wordress-Blogs. Dabei lässt sich da eigentlich recht einfach Abhilfe schaffen. Via Robots.txt lassen sich (zumindest die braven SE-Bots) von den Feeds fernhalten:


User-agent: *
Disallow: /*feed/*
User-agent: googlebot
Disallow: /*feed/*

Das gilt so für alle Feeds die über feed/in der URL erreichbar sind. In meinem Blog trifft das auf alle Feeds (inkl. Artikelbezogene Kommentarfeeds zu). Ich wusste bisher auch nicht, dass Wildcards in dieser Form in der robots.txt erlaubt sind. Der Google-Checker (Webmaster Tools) hat jedoch sein okay dazu gegeben, also nehm ich das mal so hin und werde es ab sofort so einsetzen.

Wer will, darf’s natürlich gerne mitnehmen ;)
Für die bösen Roboter gibt’s übrigens SpiderTrap. Das kommt hier gleich aus der Nachbarschaft und wirkt bei mir seit Monaten recht gut gegen BlutContentsauger. Unbedingt mal ausprobieren.

Ähnliche Beiträge

  • Autoblog in China verklagt

    Was wird das denn? Der Autblog wird von einem chinesischen Bushersteller verklagt und vor ein chinesisches Gericht geladen. Heute überbrachte uns ein Rechtspfleger des Amtsgerichtes Mitte ungewöhnliche Post. Der Inhalt ist schockierend. Ein chinesischer Bushersteller hat uns gerade nach China vorgeladen. Verlangt wird öffentliche Entschuldigung und wirtschaftliche Entschädigung. Ist das die nächste Stufe der Abmahnungen?…

  • Und wie siehst Du aus?

    Ich hab’s mal wieder Steffi gleich getan. Ist aber auch wirklich ein nettes Spielzeug. Leider ist die Auswahl bei Brillen nicht so ideal, weshalb ich arge Kompromisse eingehen musste ;) wer macht mit? Hier geht’s zum Phantombildmaker (Ultimate Flash Face). [tags]gesicht,flash,phantombild[/tags]

  • Schluss mit Kategorien

    Ich hab’s an anderer Stelle schon mal erwähnt: Kategorien sind einfach nichts für mich. Ich hab sie nun auch hier wieder gekickt. Es gibt nur noch zwei Kategorien: Eine für die normalen Beiträge und eine für die Shorties (Sideblog). Letzere bereitet mir derzeit noch Probleme. Wie ihr seht werden die embedded Tags, die ich des…

  • Mister Wong besser machen?

    Eigentlich ist es ja nicht mein Job. Als Nutzer des Social-Bookmarking-Dienstes Mister Wong habe ich natürlich aber großes Interesse daran, dass der Dienst besser wird. Daher kommen hier meine Verbesserungsvorschläge. Wer etwas hinzuzufügen hat, darf das gerne über die Kommentare tun, ich werde das dann hier zum Zwecke der Übersichtlichkeit ergänzen. Ein Link zu diesem…

  • The Venice Project – Beta

    Die meisten von Euch haben sich schon von „The Venice Project“ (TVP) gehört. TVP ist Internet-TV der neuen Generation von den Machern von Kazaa und Skype Janus Friis und Niklas Zennström. Wie Mario Sixtus vor einigen Wochen musste auch ich ein digitales Non Disclosure unterklicken, aber ich konnte nicht lesen was drin steht (nur was…

8 Kommentare

  1. Das dürfte aber auch die (wenigen) Feedreader treffen die sich an die robots.txt halten. Aber das dürften eh so in etwa 0 sein ;-)

  2. Ja. Ich hab das mit den Feeds bei mir im Blog schon etwas länger. Soweit funktioniert das auch ganz gut.
    Nun wollte ich vor kurzem mal die Bilder (die eh nicht mehr vorhanden sind) aus dem Index entfernen. Und da meinte Google das Wildcards in der robots.txt nicht erlaubt seien.

    Ich finde es auch sehr merkwürdig, da Google auf seinen eigenen Seiten behauptet mit Wildcards könnte man verschiedenen Bild-Typen von der Indexierung ausschließen (z.B. mit /*.gif)

  3. Pingback: Blog » WordPress Plugin: NoIndex Feed » Frank Helmschrott

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert