Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Spammail Sammlung

Frage Internet E-Mail

Mitglied: adminst

adminst (Level 2) - Jetzt verbinden

07.01.2010 um 19:35 Uhr, 6043 Aufrufe, 3 Kommentare

Hallo zusammen

Weiss jemand eine aktuelle Sammlung von Spammails, welche man benötigen könnte um den
Bayes vom Spamassassin zu trainieren?
Am besten in der MBOX Format.

Danke
admnist
Mitglied: maretz
07.01.2010 um 20:36 Uhr
Moin,

ich würde dir dringend empfehlen das du dir selbst eine entsprechende Sammlung anlegst. Denn das nennt sich ja "Training" für den Spamfilter damit er auf DEINE Bedürfnisse angepasst ist.

Nehmen wir nur mal an du würdest ne Sammlung bekommen bei der Mails mit Chinesichen Schriftzeichen als Spam gewertet werden. Ist vermutlich für dich zuhause ganz ok - wenn du aber beruflich mit Fernost zu tun hast bekommst du schon Probleme... Oder du bekommst nen Filter bei dem $$$ schon als Spam erkannt werden -> dumm wenn du solche Mails in der Firma ggf. einfach wegwirfst.

Und ich bin mir zimlich sicher das du ggf. ganz andere Anforderungen an nen Spam-Filter stellst als ich. So wird vielleicht der Ersteller der mbox gesagt haben das Amazon, Ebay usw. eh nur Spam-Mails sind und da keiner von seinen Kumpels bei gmx, web.de usw. sind werden auch diese Mails sofort als Spam erkannt. Was machst du wenn du diese mbox jetzt einfach in dein Training schiebst? Und würde ich dir die Box der Firma geben - möchtest du die per Hand durchsuchen? (lockere 40.000-100.000 Mails/Tag die im Spam laufen soweit ich die Catch-All reaktiviere).

Von daher kann ich nur empfehlen die Mails zum trainieren selbst in den Spam-Filter zu packen. NUR so kannst du den auf deine Bedürfnisse anpassen. Ansonsten hast du nen Spam-Filter der die Bedürfnisse von irgendwem anders (der ggf. grad wirklich günstiges Viagra sucht und dabei natürlich im Online-Kasino immer ganz vorn dabei is) passen...
Bitte warten ..
Mitglied: dog
07.01.2010 um 21:04 Uhr
Also ich würde meine Privatsammlung ja glatt spenden.
Sind aber nur so 22k

Das würde dir aber relativ wenig nützen, weil Bayes-Filter über die Zeit sogar wieder schlechter werden (weil sich die Spam-Emails eben auch verändern)...
Bitte warten ..
Mitglied: LordGurke
07.01.2010 um 22:15 Uhr
Ich habe meinen Spamassassin nach der Installation mit diesen Archiven hier trainiert:
http://untroubled.org/spam/

Ist zwar kein MBOX-Format, wenn du aber unbedingt dieses Format brauchst, kannst du es dir ja selber aus den ganzen Dateien generieren.

Nachtrag:
Wenn du ein MBOX-Format haben willst, kannst du dir dieses mit dem Script hier generieren:

01.
#!/bin/bash 
02.
 
03.
# Hier den Pfad zu deinem Spam-Archiv angeben 
04.
MAILS=`ls /pfad/zum/spam-archive/ -1r` 
05.
 
06.
for SINGLEMAIL in ${MAILS[@]} 
07.
do 
08.
     cat SINGLEMAIL >> /pfad/zum/mbox-file 
09.
     echo " " >> /pfad/zum/mbox-file 
10.
done
Du müsstest dafür dann vorher in das Verzeichnis wechseln, in dem sich die entpackte 7z-Datei befindet, sonst kann er die Dateien dann nicht mehr finden.
Bitte warten ..
Ähnliche Inhalte
Blogs
Link-Sammlung TOOLBOX HMXNETWOK GmbH (12)

Link von StefanKittel zum Thema Blogs ...

E-Mail
gelöst Spammail mit Anhängen und Links nutzen unsere Domain (12)

Frage von M.Marz zum Thema E-Mail ...

Windows Server
Multiple Farmen (Sammlungen) über einem RDS 2012R2 Broker (1)

Frage von plexxus zum Thema Windows Server ...

Neue Wissensbeiträge
Windows Installation

Unorthodoxer Weg, um an einen Offline-Installer für Adobe Flash zu kommen

(8)

Tipp von beidermachtvongreyscull zum Thema Windows Installation ...

Datenschutz

Gefährdeter Datenschutz: Firefox löscht lokale Datenbanken nicht

Information von BassFishFox zum Thema Datenschutz ...

Firewall

PfSense OpenVPN beschleunigen

Tipp von Dobby zum Thema Firewall ...

Utilities

CCleaner 5.33 mit Malware infiziert

(27)

Information von SeaStorm zum Thema Utilities ...

Heiß diskutierte Inhalte
Utilities
CCleaner 5.33 mit Malware infiziert (27)

Information von SeaStorm zum Thema Utilities ...

Festplatten, SSD, Raid
gelöst Problem mit DELL 815R Server und Windows Bluescreen (24)

Frage von Leo-le zum Thema Festplatten, SSD, Raid ...

Windows Systemdateien
Windows bootet nicht mehr Fehlermeldung 0xc0000098 (18)

Frage von franzgoerlich zum Thema Windows Systemdateien ...

Windows Netzwerk
Dateien mit Intelligenz per GPO ins Programmverzeichnis (14)

Frage von erwin.t zum Thema Windows Netzwerk ...