Blogspam-Versuch

SpamSeit längerem spukt mir schon ein Versuch bzgl. Blogspam im Kopf herum, den ich nun endlich mal starten möchte. Es geht darum Blogspam etwas näher kennenzulernen, zu sehen wie er sich entwickelt und wie man effektiv dagegen vorgehen kann. Das betrifft sowohl Kommentarspam als auch den etwas schwieriger zu bekämpfenden Trackback-Spam. Dabei soll die Bekämpfung mit möglichst wenig technischem Aufwand passieren.

Da ich natürlich nicht mein eigenes Blog für Spamversuche freigeben will, habe ich dafür unter blogspam.de neulich mal WordPress installiert. Derzeit gibt es keinerlei Antispam-Maßnahme in diesem Blog – halt doch – es ist kein nonofollow-Plugin installiert, sprich der von Google propagierte Antispammechanismus *hust* „nofollow“ kommt zum Einsatz.

Das Blog soll nun nach und nach mit mehr oder weniger sinnvollen Inhalten versehen und hier und da mal verlinkt werden, in der Hoffnung dort bald viele Spambots zu sehen. Im ersten Schritt will ich beobachten wie sich die Anzahl der Spams zu Inhalten und Links verhält. Im zweiten Schritt möchte ich dann verschiedene Antispam-Mechanismen testen um am Ende hoffentlich einen zu finden, der hohe Effektivität bei wenig Aufwand bietet. Es geht mir dabei primär darum mir bisher nicht bekannte Plugins und Mechanismen auszuprobieren, ohne dabei den Kommentarfluss im eigenen Blog zu stören.

Wer sich gerne mit sinnlosen Inhalten beteiligen will, kann gerne einen Account bei BlogSpam haben. Announcen eigener Beiträge oder des eigenen Blogs ist natürlich erlaubt – Links auf Spamseiten, Affiliatelinks oder ähnliches natürlich nicht. Diejenigen die sich beteiligen wollen, sollten bereits mit einem eigenen Blog bekannt sein. Außerdem freue ich mich natürlich über den ein oder anderen unterstütztenden Link, damit die Spambots möglichst bald zuschlagen.

Kennt jemand noch ein Plugin für WordPress, dass in der Lage ist Statistik über Kommentare zu führen? Ich bin noch unsicher wie genau ich darüber Buch führe. Ich will auf jeden Fall die Anzahl der Kommentare den eingehenden Technorati-Links gegenüber stellen. Wer noch Ideen hat, was man ggfs. noch beobachten könnte, darf sich natürlich gerne einbringen.

45 Gedanken zu „Blogspam-Versuch“

  1. wäre das semmelstatz nicht was für dich?

    aber die idee ist gut und unterstütze ich gerne mit einen beitrag und einem entsprechendem link! solange du am ende zu einem ergebnis kommst und uns teilhaben lässt ;)

  2. @Jared: ja semmelstatz ist schon okay, solange sich die besucherzahlen nicht überschlagen. Dann wirds leider ne Last.

    @Falk: danke für den Tipp.

    @Tom: Signup ist aus, aber wäre eigentlich ein Versuch wie viele Spamsignups noch dazu kommen. Ich schalte eben mal an, dann kannst dich reggen. Ich mach Dich dann zum Autor.

  3. Hihi,
    ich hatte vor kurzem auch mal ein Spam-Blog gestartet. Naja, man könnte es Spam nennen. Allerding shat sich da bisher seltsamerweise der SPAM auf dem Blog in Grenzen gehalten. Da ist nur Nofollow drin und das wars .
    Aber schick mir doch mal ein logIn dann schauen wir mal ;-)

  4. Pingback: Das Farliblog
  5. Was bei mir übrigens super zum Spammer-Anlocken funktioniert hat, war einen sachlichen Artikel über seltsame Medikament zu schreiben, die gerne bespamt werden.
    Ich hab‘ zum Teil auf dem Artikel mehr Zugriffe als auf die index.php :-)
    Sum1 hatte damit, glaub‘ ich angefangen und ein Haufen Blogger haben sich darauf verlinkt.
    Wäre für einen Test auf alle Fälle interessant, sich da miteinzuklinken.

    Viel Spaß! ;-)

  6. Bei dem Domain-Namen werden sicher einige Kommentarspammer, welche die Inhalte händisch eingeben, abgeschreckt. Vielleicht wäre es besser, das Blog weniger auf das Experiment bezogen zu gestalten?

  7. @frank, ok.
    Hat geklappt, habe mal einen Artikel generiert. Schau mal drüber, ist aber auch sehr spammig gehalten ;-)
    @markus
    de rTeil händischer Spammer ist verschwindend gering, lohnt sich ned. Was inter essant wäre mal so einen SpamBot zu checken, wie das läuft. Aber der, den ich habe kann man nur global ansetzen, nicht gezielt….

  8. Wie Markus bereits schrieb: Denke ich auch, dass der Domainname schon einige abschrecken wird. Ansonsten finde ich die Idee aber nicht schlecht. Einfach mal schauen, was sich da so alles ansammelt.

  9. Pingback: Spamforschung | Alagamus
  10. Meine WP-Zeiten sind nun vorbei und ich weiß deshalb nicht, was sich in der Zwischenzeit auf dem WP-Plugin-Markt getan hat. Ich stelle bei mir (s9y) fest, dass viele Spammer entweder eine Hotmail-Addi haben oder mit einer Blogspot-URI aufschlagen, oft benutzen sie sogar beides zusammen.

    Hilft das Euch etwas?

  11. Pingback: Blogspam: Frank Helmschrotts Testsite :: frank huncks blog
  12. @Martina: Es geht im moment weniger um Plugins – ob WP oder s9y. Erstmal müssen Inhalte her, dann können wir die Muster der Spammer erkennen. Einfache Muster wie Herkunft, Link oder Email sind natürlich eher weniger geeignet um spammer auszufiltern – damit würde es viel zu viele „echte“ erwischen.

    @Micha: Hab‘ Dich als Autor freigeschalten – leg los.

  13. Pingback: Wo bleibt der Kommentar Spam?
  14. Pingback: datenschmutz.net » Der Tief-Spam-Forscher - ritchie pettauer schreibt über web 2.0, medien.kultur.technik und objects trouvés im www
  15. Pingback: Benedikt Rieke-Benninghaus » Blogspam
  16. Pingback: Blog » Der frühe Spammer fängt den Trackback » Frank Helmschrott
  17. Pingback: BlogSpam.de at ogeeBloggin’
  18. Pingback: Blogspam Projekt - dynamicinternet
  19. Ich habe mir ein kleines Plugin gebastelt welches mir alle POST/GET-Daten per Mail zuschickt. Ist schon sehr interessant was die Spammer alles absenden um einen Kommentar/Trackback zu setzen.

    Mein wirksamstes Mittel das ich aufgrund dieser Erkenntnisse entwickelt habe: Alle Kommentare die in weniger als 3 Sekunden gepostet wurden, sind Spam -> Trash.
    Des weiteren war sehr interessant zu sehen welche Dateien die Spammer bevorzugt aufrufen. Da stach mir die wp-comments-post.php ins Auge. Den Direktzugriff auf diese Datei per .htaccess unterbunden und schon war wieder ein Großteil des Spams verschwunden.

    Mittlerweile kann ich keine großartigen Aussagen über (Kommentar-)Spam mehr machen, da keiner mehr durch kommt. Lediglich ab und zu ein bisschen Trackback-Spam. Den versuche ich allerdings mit einer Kombination aus Whitelist und Abfrage von Technorati in den Griff zu bekommen.

    Noch ein Tipp für das Test-Blog: Vor dem Relaunch meines Blogs hatte ich den meisten Spam auf Beiträge mit englischen Titel. Wörter wie Backup, Dirty Content, Last Request, Error in application antville, usw. haben bei mir den Spam geradezu magisch angezogen. Bei einigen Beiträgen so sehr, das ich Kommentare&Trackbacks abschalten musste.

  20. Hi, ich finde die Idee gut, und steuere gerne einen Link von webrocker.de aus bei.
    Ich habe mich auch bei blogspam.de registriert und sorge gerne für etwas (fake) Content.
    Ich benutze in meinem (deutschsprachigen) Blog häufig englische Titel, so wie WordPress Voodoo Revisited, und wie Ralf schon schrieb, ziehen diese Beiträge den Spam geradezu an.

  21. Ich möchte einfach mal ein paar Fragen die mir so durch den Kopf gehen notieren.
    Ist für die Analyse auch daran gedacht, die verlinkten Sites zu bewerten, um mehr über die Beweggründe und Strategien zur Erreichung ihrer Ziele der Spam-bot-Betreiber zu erfahren?
    Könnte man nicht längerfristig zusätzlich zu den vorgeschlagenen Filtern Listen, ähnlich wie bei Mail-Spam, ins Leben rufen?
    Vielleicht könnte man diese um eigene Analysetools bzw. -bots ergänzen, die Datenbestände von Blogs analysieren, bereinigen und die Listen füttern?
    Falls relevant, bestünde die Möglichkeit, die verlinkten Sites auf die Verbreitung von „Schadsoftware“ (Viren, Trojaner, Würmer, …) zu untersuchen und neben dem Eintag auf der Badlist entsprechende Maßnahmen einleiten?
    …..

  22. Pingback: f Der Boehse Blog 2f
  23. Pingback: Blogspam-Versuch - Robtesify.de
  24. Hallo Paule,

    Nein eine Bewertung der verlinkten Seiten ist nicht geplant. In meinen Augen unterscheidet sich der Zweck zwischen einzelnen bespammten Seiten kaum.

    Welche Listen? Black/Whitelists? Die kommen m.W. bei SpamKarma2 schon zum Einsatz.

    Was Analysetools angeht ist das natürlich grundsätzlich immer eine tolle Sache. Fragt sich immer nur wer’s machen soll ;) Du darfst dich gerne einbringen ;)

  25. Brauchst du noch Hilfe und gibt es schon erste Erkenntnisse ?
    Im Grunde ist Kommentarspam ja nichts anderes als jede Form von Formularspam, was schon echt nervt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.