Moin!
Ich würde ganz gerne meinen frisch aufgsetzten Spamassassin ein wenig trainieren. Habe den alten Spam immer weggeworfen und deshalb kann ich ihn derzeit nicht richtig trainieren. Gibt es:
a) Andere Möglichkeiten?
b) Unmengen an gesammeltem Spam?
(edit fal: Topictitel)
Trag deine email adresse in newsletter ein :)
Da meldet sich garantiert eine Tanja , Jasmin oder Ivone.
Ach die ganzen schönen Frauen, die sich bei mir melden wollen gar nichts von mir? Aber die Rolex-Angebote sind doch wirklich mal sehr günstig. Und über Viagra und Cialis wird man ausreichend informiert :D
hm. Ich kenne mich mit Spamassasin nicht aus, aber meinst du, es bringt was, wenn ich dir meine 1k Spam Mails schicke? Die Mails tragen ja alle _meinen_ Absender, gingen ueber _meinen_ Server, haetten _meine_ Haeder, …
Wenn dann muesste man doch versuchen die Mails so gut wie moeglich zu reproduzieren, also nicht weiterleiten, sondern die selbe Mail nochmal verschicken. ?
Angenmommen Du bewarst deine Spam-Mail in ~/Mail/SPAM/cur/ auf. Dann könntest Du das ganze Zeugs in einen tarball packen und mir schicken. Dadurch blieben die Header unberührt und die Nachrichten somit 100%ig nützlich für meinen Spamassassin. Poste aber mal vorher, wie groß der Tarball wäre…
Dadurch blieben die Header unberührt und die Nachrichten somit 100%ig nützlich für meinen Spamassassin.
Ne, eben gerade nicht, die Mails gingen ja an Muelli und nicht an Dich.
Ich weiß nicht, wo da der große Unterschied ist. Lernt der Spamassassin etwa auch Anhand des Empfängers? Ok, die Route der Mail wird bestimmt irgendwie mit einbezogen. Aber der Content, Subjects usw bleiben ja unberührt… Und im Gegensatz zu einer Weiterleitung habe ich Mülli nicht als Absender. Sonst landet der nämlich mit an Sicherheit grenzender Wahrscheinlichkeit in meinem Spam-Ordner…
Die KI wird ganz schnell lernen: Mails an Mülli sind Spam, Mails die nicht an Mülli gehen sind kein Spam, case closed.
Moin!
Ich würde ganz gerne meinen frisch aufgsetzten Spamassassin ein wenig trainieren. Habe den alten Spam immer weggeworfen und deshalb kann ich ihn derzeit nicht richtig trainieren. Gibt es:
a) Andere Möglichkeiten?
Warum lässt du dir mit dem Trainieren nicht Zeit und machst es mit dem ab jetzt kommenden Spam? [img]
http://www.fb18.de/gfx/22.gif[/img]
Ich hab die Erfahrung gemacht, dass schon in kurzer Zeit recht gute Erfolge erzielt werden.
Immer diese Hektiker. [img]
http://www.fb18.de/gfx/28.gif[/img]
Warum lässt du dir mit dem Trainieren nicht Zeit und machst es mit dem ab jetzt kommenden Spam? [img]http://www.fb18.de/gfx/22.gif[/img]
Ich hab die Erfahrung gemacht, dass schon in kurzer Zeit recht gute Erfolge erzielt werden.
Immer diese Hektiker. [img]http://www.fb18.de/gfx/28.gif[/img]
Werde ich dann wohl mal machen. Schade, ich dachte es geht schneller.
Hm, vor allem macht es, glaube ich, nicht viel Sinn eine unglaublich volle "Spam-Wörter"-Liste zu haben, aber keine Mails die du durchlassen willst…
Ansonsten hätte ich aufm Mailserver etwa 300 MB Spam liegen, die sind allerdings auch alle schon vom SpamAssassin markiert
Naja, meine Mails habe ich ja behalten (so die letzten 5 Jahre oder so habe ich archiviert). Ham wäre also genug da…
Sammelt ihr wirklich euren ganzen $p@@mm? [img]
http://www.fb18.de/gfx/18.gif[/img]
OK, hab ja auch einen Ordner mit 1451 Mails und einen weiteren mit 25 (Das sind die, bei denen vor Fraud-Code gewarnt wurde…)
Leider haben meine Mails von der alten Festplatte nicht überdauert, so dass ich meine Lieblings-Scams verloren hab (unter anderen den von Suha Arafat). [img]
http://www.fb18.de/gfx/16.gif[/img]
Sammelt ihr wirklich euren ganzen $p@@mm? [img]http://www.fb18.de/gfx/18.gif[/img]
Das bisschen, was ich durch FSR und durch Keysigning krieg, lösch ich. Nimmt doch Platz weg. [img]
http://www.fb18.de/gfx/15.gif[/img]
Was raussortiert wird in den Junk-Ordner, lösch ich auch alle Weile mal.
Sammelt ihr wirklich euren ganzen $p@@mm? [img]http://www.fb18.de/gfx/18.gif[/img]
Naja, in den Spam-Ordner wechseln und das Zeug loeschen ist mehr Arbeit als ich dem Muell zugestehe… Und auf dem IMAP-Server stoerts ja nicht ;)
Sammelt ihr wirklich euren ganzen $p@@mm? [img]http://www.fb18.de/gfx/18.gif[/img]
Naja, in den Spam-Ordner wechseln und das Zeug loeschen ist mehr Arbeit als ich dem Muell zugestehe… Und auf dem IMAP-Server stoerts ja nicht ;)
Was hast du denn für einen email-client? und hat der imap-server kein quota?
Was hast du denn für einen email-client? und hat der imap-server kein quota?
Evolution. Ok, ich müsste bloß in den Spam-Ordner wechseln, warten bis die Header geladen sind, ^A und Del drücken. Aber ich bin faul… ;)
Der Server hat sozusagen ein Hardwarequota von 40 GB. Bis dahin dauerts aber noch n bisschen…
Lernt der Spamassassin etwa auch Anhand des Empfängers?
Ich kenne das Programm nicht, aber vorstellen kann ich's mir, insbesondere, da du ja auch eine eigene Internetadresse hast. Ich selbst bekomme oft Mails an "info@" und "webmaster@", obwohl die gar nicht eingerichtet sind. Die werden dann natürlich an meinen normalen Account weitergeleitet - aber ein Spamfilter kann anhand des Empfängers schonmal eine höhere Spam-Einstufung vornehmen, denn normalerweise geht ja an diese Accounts nichts.
Grüße aus Kärnten [img]
http://www.fb18.de/gfx/25.gif[/img]
Gerri
Was hast du denn für einen email-client? und hat der imap-server kein quota?
Evolution. Ok, ich müsste bloß in den Spam-Ordner wechseln, warten bis die Header geladen sind, ^A und Del drücken. Aber ich bin faul… ;)
Der Server hat sozusagen ein Hardwarequota von 40 GB. Bis dahin dauerts aber noch n bisschen…
und evolution unterstützt nicht das automatische löschen von spam mails nach n tagen???
Evolution weiß nicht, das das Spam ist, sortieren tut mein Mailserver
ansosnten nimm muellis tgz und nen s/muellis email/hackberts email/g
damit haste deine email als empfaenger und dein assasin muesstes checken
…Du bewarst deine Spam-Mail in ~/Mail/SPAM/cur/ auf.
Was'n das für ein Storage? [img]
http://www.fb18.de/gfx/7.gif[/img] Spaß beiseite: Mailheader vom MTA interessieren SpamAssassin nur wenn es Networktests durchführt. der Bayes-Filter wird davon nicht berührt. Und nebenbei: Den Bayes-Filter *nur* auf Spam zu trainieren ist nicht sonderlich klug. SA muss auch lernen, was *kein* Spam ist. Irgendwo tief in der SA-Doku steht auch drinn, dass bayes erst dann zuschlägt, wenn er (per Standardeinstellung) 300 Spam- und ebensoviele Hammails bekommen hat.
Wenn du willst, kann ich dir mal ein Dump meiner Bayes Tokens zuschicken. Die kommen aus ca. 10.000 handsortierten eMails und sind unkomprimiert ca. 9,9MB groß. Ob dir das nützt ist aber fraglich: Zum einen ist der Spam, den ich (nicht mehr) bekomme sicherlich anders, als der, den du bekommst. zum anderen schmeißt SA die Tokens nach einer gewissen Zeit weg, um a) performant zu bleiben und b) dafür zu sorgen, dass der alte Spam nicht die Erkennung von neuem beeinträchtigt.
Nö, ist schon ok. Habe inzwischen knapp 250 Spam-Mails angehäuft. Ham habe ich mehr als genug (so 5.000 Mails oder so). Danke trotzdem…