Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Spammail Sammlung

Frage Internet E-Mail

Mitglied: adminst

adminst (Level 2) - Jetzt verbinden

07.01.2010 um 19:35 Uhr, 5875 Aufrufe, 3 Kommentare

Hallo zusammen

Weiss jemand eine aktuelle Sammlung von Spammails, welche man benötigen könnte um den
Bayes vom Spamassassin zu trainieren?
Am besten in der MBOX Format.

Danke
admnist
Mitglied: maretz
07.01.2010 um 20:36 Uhr
Moin,

ich würde dir dringend empfehlen das du dir selbst eine entsprechende Sammlung anlegst. Denn das nennt sich ja "Training" für den Spamfilter damit er auf DEINE Bedürfnisse angepasst ist.

Nehmen wir nur mal an du würdest ne Sammlung bekommen bei der Mails mit Chinesichen Schriftzeichen als Spam gewertet werden. Ist vermutlich für dich zuhause ganz ok - wenn du aber beruflich mit Fernost zu tun hast bekommst du schon Probleme... Oder du bekommst nen Filter bei dem $$$ schon als Spam erkannt werden -> dumm wenn du solche Mails in der Firma ggf. einfach wegwirfst.

Und ich bin mir zimlich sicher das du ggf. ganz andere Anforderungen an nen Spam-Filter stellst als ich. So wird vielleicht der Ersteller der mbox gesagt haben das Amazon, Ebay usw. eh nur Spam-Mails sind und da keiner von seinen Kumpels bei gmx, web.de usw. sind werden auch diese Mails sofort als Spam erkannt. Was machst du wenn du diese mbox jetzt einfach in dein Training schiebst? Und würde ich dir die Box der Firma geben - möchtest du die per Hand durchsuchen? (lockere 40.000-100.000 Mails/Tag die im Spam laufen soweit ich die Catch-All reaktiviere).

Von daher kann ich nur empfehlen die Mails zum trainieren selbst in den Spam-Filter zu packen. NUR so kannst du den auf deine Bedürfnisse anpassen. Ansonsten hast du nen Spam-Filter der die Bedürfnisse von irgendwem anders (der ggf. grad wirklich günstiges Viagra sucht und dabei natürlich im Online-Kasino immer ganz vorn dabei is) passen...
Bitte warten ..
Mitglied: dog
07.01.2010 um 21:04 Uhr
Also ich würde meine Privatsammlung ja glatt spenden.
Sind aber nur so 22k

Das würde dir aber relativ wenig nützen, weil Bayes-Filter über die Zeit sogar wieder schlechter werden (weil sich die Spam-Emails eben auch verändern)...
Bitte warten ..
Mitglied: LordGurke
07.01.2010 um 22:15 Uhr
Ich habe meinen Spamassassin nach der Installation mit diesen Archiven hier trainiert:
http://untroubled.org/spam/

Ist zwar kein MBOX-Format, wenn du aber unbedingt dieses Format brauchst, kannst du es dir ja selber aus den ganzen Dateien generieren.

Nachtrag:
Wenn du ein MBOX-Format haben willst, kannst du dir dieses mit dem Script hier generieren:

01.
#!/bin/bash 
02.
 
03.
# Hier den Pfad zu deinem Spam-Archiv angeben 
04.
MAILS=`ls /pfad/zum/spam-archive/ -1r` 
05.
 
06.
for SINGLEMAIL in ${MAILS[@]} 
07.
do 
08.
     cat SINGLEMAIL >> /pfad/zum/mbox-file 
09.
     echo " " >> /pfad/zum/mbox-file 
10.
done
Du müsstest dafür dann vorher in das Verzeichnis wechseln, in dem sich die entpackte 7z-Datei befindet, sonst kann er die Dateien dann nicht mehr finden.
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(8)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Heiß diskutierte Inhalte
Microsoft
Ordner mit LW-Buchstaben versehen und benennen (21)

Frage von Xaero1982 zum Thema Microsoft ...

Netzwerkmanagement
gelöst Anregungen, kleiner Betrieb, IT-Umgebung (18)

Frage von Unwichtig zum Thema Netzwerkmanagement ...

Windows Update
Treiberinstallation durch Windows Update läßt sich nicht verhindern (17)

Frage von liquidbase zum Thema Windows Update ...