Blogspam-Experiment: Reset und Spamschutz

So, nun ist passiert was irgendwann kommen musste. Das Blogspam-Projekt (blogspam.de) hat die Grenzen des Shared-Hosters gesprengt und Dreamhost hat die Seite gesperrt. Um größere Probleme zu vermeiden, habe ich nach reaktivierung die Kommentardatenbank (knapp 150.000 Kommentare) geleert und Akismet aktiviert.

Diese Mail erreichte mich dazu von Dreamhost:

I have disabled your site blogspam.de for causing severe problems with
the squirt server, plus your wordpress database has 147,280 spam
comments. The apache status page showed a flood of POST requests, most
to the URL:

/2007-04/spam-comment-spam-und-trackback-spam/

Ich muss dazu sagen, dass ich die Sperre absolut nachvollziehen kann. Die Zeit die einzelne Seiten teilweise zum laden gebraucht haben, hat erahnen lassen, was die Datenbank für eine Aktion fährt, wenn gerade ein Beitrag mit 5.000 oder mehr Kommentaren aufgerufen wird.

Leider habe ich in der Vergangenheit nie wirklich die Zeit und den Elan dafür gehabt die ganze Aktion mal etwas genauer zu analysieren. Festhalten lässt sich jedoch die Tatsache, dass der größte Teil der Spamkommentare durch einen kleinen Teil der Beiträge entsteht. Es gibt offenbar einige wenige Beiträge die die besondere Aufmerksamkeit der Spammer erregen. Das wiederum lässt den Rückschluss zu, dass die meisten, großen Spammer ein Blog / eine Website nicht komplett spidern, sondern nur den Beitrag bespammen, den sie gezielt über Suchmaschinen zu einem bestimmten Keyword finde.

Ich werde das Projekt aber dennoch weiterlaufen lassen. Im nächsten Schritt interessiert mich nun wie sich das Verhalten der Spammer bei entsprechend wasserdichtem Spamschutz verändert und ob die Frequen an täglichem Spam eher steigt oder eher sinkt. Ich werde das ganze vorerst mal auf Akismet als Spamschutz konzentrieren und sehen wieviel dann noch durchrutscht.

5 Gedanken zu „Blogspam-Experiment: Reset und Spamschutz“

  1. Haste denn noch ne Kopie von der Datenbank? Mit deinen paar Spamcomments könnte man sicherlich eine nette Statistik machen (Herkunft, meist gespammtes Key, Zieldomains,.. ) :-)

  2. Die Auswertung der Keywords würde ich wirklich gern sehen. Ich mache bei mir so etwas regelmäßig und es ergeben sich Kuriositäten, wonach die Leute so suchen. Das meiste stammt dabei tatsächlich aus Kommentaren…

  3. Pingback: Links aus der Nachbarschaft am 01. Dezember « Natividad Hersh - Blog

Kommentar verfassen