Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Spammail Sammlung

Frage Internet E-Mail

Mitglied: adminst

adminst (Level 2) - Jetzt verbinden

07.01.2010 um 19:35 Uhr, 5971 Aufrufe, 3 Kommentare

Hallo zusammen

Weiss jemand eine aktuelle Sammlung von Spammails, welche man benötigen könnte um den
Bayes vom Spamassassin zu trainieren?
Am besten in der MBOX Format.

Danke
admnist
Mitglied: maretz
07.01.2010 um 20:36 Uhr
Moin,

ich würde dir dringend empfehlen das du dir selbst eine entsprechende Sammlung anlegst. Denn das nennt sich ja "Training" für den Spamfilter damit er auf DEINE Bedürfnisse angepasst ist.

Nehmen wir nur mal an du würdest ne Sammlung bekommen bei der Mails mit Chinesichen Schriftzeichen als Spam gewertet werden. Ist vermutlich für dich zuhause ganz ok - wenn du aber beruflich mit Fernost zu tun hast bekommst du schon Probleme... Oder du bekommst nen Filter bei dem $$$ schon als Spam erkannt werden -> dumm wenn du solche Mails in der Firma ggf. einfach wegwirfst.

Und ich bin mir zimlich sicher das du ggf. ganz andere Anforderungen an nen Spam-Filter stellst als ich. So wird vielleicht der Ersteller der mbox gesagt haben das Amazon, Ebay usw. eh nur Spam-Mails sind und da keiner von seinen Kumpels bei gmx, web.de usw. sind werden auch diese Mails sofort als Spam erkannt. Was machst du wenn du diese mbox jetzt einfach in dein Training schiebst? Und würde ich dir die Box der Firma geben - möchtest du die per Hand durchsuchen? (lockere 40.000-100.000 Mails/Tag die im Spam laufen soweit ich die Catch-All reaktiviere).

Von daher kann ich nur empfehlen die Mails zum trainieren selbst in den Spam-Filter zu packen. NUR so kannst du den auf deine Bedürfnisse anpassen. Ansonsten hast du nen Spam-Filter der die Bedürfnisse von irgendwem anders (der ggf. grad wirklich günstiges Viagra sucht und dabei natürlich im Online-Kasino immer ganz vorn dabei is) passen...
Bitte warten ..
Mitglied: dog
07.01.2010 um 21:04 Uhr
Also ich würde meine Privatsammlung ja glatt spenden.
Sind aber nur so 22k

Das würde dir aber relativ wenig nützen, weil Bayes-Filter über die Zeit sogar wieder schlechter werden (weil sich die Spam-Emails eben auch verändern)...
Bitte warten ..
Mitglied: LordGurke
07.01.2010 um 22:15 Uhr
Ich habe meinen Spamassassin nach der Installation mit diesen Archiven hier trainiert:
http://untroubled.org/spam/

Ist zwar kein MBOX-Format, wenn du aber unbedingt dieses Format brauchst, kannst du es dir ja selber aus den ganzen Dateien generieren.

Nachtrag:
Wenn du ein MBOX-Format haben willst, kannst du dir dieses mit dem Script hier generieren:

01.
#!/bin/bash 
02.
 
03.
# Hier den Pfad zu deinem Spam-Archiv angeben 
04.
MAILS=`ls /pfad/zum/spam-archive/ -1r` 
05.
 
06.
for SINGLEMAIL in ${MAILS[@]} 
07.
do 
08.
     cat SINGLEMAIL >> /pfad/zum/mbox-file 
09.
     echo " " >> /pfad/zum/mbox-file 
10.
done
Du müsstest dafür dann vorher in das Verzeichnis wechseln, in dem sich die entpackte 7z-Datei befindet, sonst kann er die Dateien dann nicht mehr finden.
Bitte warten ..
Ähnliche Inhalte
Blogs
Link-Sammlung TOOLBOX HMXNETWOK GmbH (12)

Link von StefanKittel zum Thema Blogs ...

Viren und Trojaner
Analyse einer Spammail mit Schadcode (3)

Link von Knorkator zum Thema Viren und Trojaner ...

E-Mail
gelöst Spammail mit Anhängen und Links nutzen unsere Domain (12)

Frage von M.Marz zum Thema E-Mail ...

Neue Wissensbeiträge
Drucker und Scanner

Samsung SL-M4025ND, firmware update und (kompatible) Tonerkassetten

(1)

Erfahrungsbericht von markus-1969 zum Thema Drucker und Scanner ...

Router & Routing

PfSense auf Supermicro Intel Xeon D-15x8 SoC Bare Bone

Tipp von Dobby zum Thema Router & Routing ...

Windows Server

Exchange 2010 auf Windows Server 2016 und AD

(2)

Tipp von Herbrich19 zum Thema Windows Server ...

KVM

How to: Libvirt Port forwarding

(2)

Anleitung von fundave3 zum Thema KVM ...

Heiß diskutierte Inhalte
Basic
Programmierung von Windows Programmen (9)

Frage von Ghost108 zum Thema Basic ...

C und C++
Fehlendes verständiss von C und C++ (8)

Frage von zelamedia zum Thema C und C ...