Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Aufgabe für Anspruchsvolle! Dateiinhalt einer Email auslesen

Frage Entwicklung

Mitglied: Abdelhalim

Abdelhalim (Level 1) - Jetzt verbinden

22.02.2007, aktualisiert 14:00 Uhr, 6136 Aufrufe, 2 Kommentare, 1 Danke

Ich habe eine wirkliche Aufgabe für Anspruchsvolle! (Möglicherweise Lösbar)
Also wir erhalten im Unternehmen immer wieder Emails von einer Tochtergesellschaft. Diese Emails beinhalten gescannte Faxe im Anhang. Der Name dieser TIF-Dateien lautet meistens so: "pp000000", somit spiegeln sie nicht den Inhalt der Datei wieder, also man erkennt den Inhalt nicht.
Das große Problem ist jetzt, die TIF-Dateien so zu benennt, dass es dem Inhalt entspricht!
Vorteil: Diesen bestimmten Namen findet man im jeden Dokument genau an einer Stelle!

Also heißt das, wir brauchen eine OCR-Software z.B. Abbyy Finereader der die Email öffnet -> den Namen in dieser bestimmten Zeile entnimmt -> und das Dokument umbenennt -> am besten die Datei dahin speichert, wo man es haben möchte.

Bisher hat das eine unserer Mitarbeiterin gemacht ;-(
Das heißt es Kostet viel Zeit, zweitens machen Menschen Fehler (vertippen etc.)…

Das große Ziel ist es, wenn wir das geschafft haben, diese Faxe in eine vorhandene Datenbank einzupflegen und den zugehörigen Aufträgen zuzuordnen.

Jetzt seit Ihr gefragt, wie bekomme ich das hin?

Boah, ich glaube es ist einigermaßen rausgekommen was ich beabsichtige.
Wenn nicht, fragt bitte nach!

Danke im Voraus!

Mit freundlichen Grüßen

Abdel
Mitglied: filippg
22.02.2007 um 13:51 Uhr
Hallo,

tja, das Problem dürfte die OCR sein. Ich kenne keine, die über die Kommandozeile bedienbar ist, kenne mich bei OCR aber auch sehr wenig aus.
Was kein Problem ist, ist eine eMail zu parsen, den Anhang herauszuziehen, dort aus einer Grafik einen bestimmten Bereich herauszuschneiden (steht der Name immer an einer fixen absoluten Position?) und in eine Datei zu speichern. Den Dateinamen könnte man bei einem Kommandozeilenprogramm mit übergeben, nach dessen Lauf das Ergebnis (z.B. eine .txt-Datei) auswerten und das ganze unter einem neuen Namen abspeichern. Lässt sich beispielsweise in C# alles halbwegs unaufwendig erledigen (TIF müsste vom .NET-Framework unterstützt werden, sollte man aber nochmal nachlesen).

Die Frage bleibt aber auch noch, ob man sich auf die OCR hundertprozentig verlassen möchte.
Und wenn das mit der OCR nicht klappt könnte man den Aufwand der Mitarbeiterin verringern, in dem man ein Programm macht, dass alles bis auf eben OCR macht; die Mitarbeiterin bekommt dann einfach das Fax/den entsprechenden Ausschnitt angezeigt, gibt in ein Textfeld den Namen ein und klickt auf speichern (eMail öffnen, Anhang öffnen, Speicherpfad eingeben entfällt). Damit hätte man auch gleich eine manuelle Kontrolle.

Filipp
Bitte warten ..
Mitglied: ratzla
22.02.2007 um 14:00 Uhr
Das extrahieren des mail Anhangs lässt sich grundsätzlich mit procmail (unter Unix/Linux) realisieren.
Was es da für den Kleinweich-Austauscher (MS Exchange) gibt, weiss ich nicht.

Leider gibt es aber für Linux -nach meinem Wissensstand- noch keine wirklich gute OCR Software.

Noch ein Haken: Der Finereader (zumindest der den ich kenne) liefert nur Office Formate und ist auch nicht über Kommandozeile ansteuerbar. Aber ich glaube es gibt da eine Serverversion die so was kann.
Noch was: Die Fehlerrate von OCR ist relativ hoch, gerade bei Faxen. Man muss außerdem noch ganz bestimmte Textstellen im Fax erkennen (ich nehme nicht an dass das die Info zum Generieren in der ersten Zeile steht).
Die Sache wird vermutlich wirklich eine Herausforderung.
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
Script Dateiinhalt auslesen und verschieben oder kopieren Batch
gelöst Frage von Slater55Batch & Shell6 Kommentare

Hallo, ich benötige Hilfe zum Thema Scripten. Ich habe folgendes Problem. Wir nutzen in unserer Firma (mit 4 Töchterfirmen) ...

Entwicklung
Aufgabe zum überprüfen einer anderen Aufgabe
Frage von treshaEntwicklung4 Kommentare

Hallo Gemeinde! Ich möchte ein Skript erstellen, die eine Aufgabe überprüft und evtl "repariert" (also die auftretenden Fehler behebt). ...

Batch & Shell
Bash: Email und Name auslesen
Frage von SIPSIPBatch & Shell29 Kommentare

Hallo zusammen Brauche eure Hilfe, verzweifle fast Muss aus einer grossen csv Datei mit HTML Inhalt E-Mail Adresse und ...

Batch & Shell
In For-Schleife nach Dateiinhalt Filtern
Frage von AndroxinBatch & Shell5 Kommentare

Guten Tag, ich habe ein Shellscript, welches Dateien, die max. 30 Tage alt sind, aus einem definierten Verzeichnis ausliest, ...

Neue Wissensbeiträge
Apple

IOS 11.2.1 stopft HomeKit-Remote-Lücke

Tipp von BassFishFox vor 1 TagApple

Das Update für iPhone, iPad und Apple TV soll die Fernsteuerung von Smart-Home-Geräten wieder in vollem Umfang ermöglichen. Apple ...

Windows 10

Windows 10 v1709 EN murkst bei den Regionseinstellungen

Tipp von DerWoWusste vor 1 TagWindows 10

Dieser kurze Tipp richtet sich an den kleinen Personenkreis, der Win10 v1709 EN-US frisch installiert und dabei die englische ...

Webbrowser

Kein Ton bei Firefox Quantum über RDP

Tipp von Moddry vor 1 TagWebbrowser

Hallo Kollegen! Hatte das Problem, dass der neue Firefox bei mir auf der Kiste keinen Ton hat, wenn ich ...

Internet

EU-DSGVO: WHOIS soll weniger Informationen liefern

Information von sabines vor 1 TagInternet4 Kommentare

Wegen der europäische Datenschutzgrundverordnung stehen die Prozesse um die Registrierung von Domains auf dem Prüfstand. Sollte die Forderungen umgesetzt ...

Heiß diskutierte Inhalte
Hardware
Kein Bild mit nur einer bestimmten Grafikkarten - Mainboard Konfiguration
gelöst Frage von bestelittHardware18 Kommentare

Hallo zusammen, ich hatte schon einmal eine ähnliche Frage gestellt. Damals hatte ich genau das gleiche Problem. Allerdings lies ...

Windows Server
RODC kann nicht aus Domäne entfernt werden
Frage von NilsvLehnWindows Server18 Kommentare

HAllo, ich arbeite in einem Universitätsnetzwerk mit 3 Standorten. Die Standorte haben alle ein ESXi Cluster und auf diesen ...

Hardware
Links klick bei Maus funktioniert nicht
gelöst Frage von Pablu23Hardware16 Kommentare

Hallo erstmal. Ich habe ein Problem mit meiner relativ alten maus jedoch denke ich nicht das es an der ...

Netzwerkmanagement
Mehrere Netzwerkadapter in einem PC zu einem Switch zusammenfügen
Frage von prodriveNetzwerkmanagement16 Kommentare

Hallo zusammen Vorweg, ich konnte schon einige IT-Probleme mit Hilfe dieses Forums lösen. Wirklich klasse hier! Doch für das ...