Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Scannen mit Texterkennung und Automatischer Benennung von Dateien

Frage Microsoft Microsoft Office

Mitglied: Dustin781

Dustin781 (Level 1) - Jetzt verbinden

07.04.2013 um 12:09 Uhr, 5376 Aufrufe, 4 Kommentare

Ich suche ein Programm, was einscannt und die gescannten Dateien (normal nur Rechnungen) benennt.

Hallo,

wir bekommen in der Firma Pro Woche ca. 50 Rechnungen von 5 Lieferanten.

Also relativ übersichtlich.

Nun hätte ich gerne ein Programm, wo ich einfach den Stapel Rechnungen auf meinen Einzahlblatt-USB-Twain-Kompatiblen Scanner legen und das Zeug mit Texterkennung durch laufen lassen kann.


Da bei den Rechnungen steht immer alles ein gleicher Stelle, damit könnte man perfekterweise die Dateien Automatisch Bennen lassen.

Einige Rechnungen haben auch mehr als eine Seite, diese sind aber immer numeriert.


z.B.
JJJJ-MM-TT Lieferant - Rechnungsnummer - Summe.pdf

Davon 5 verschiedene

und natürlich
JJJJ-MM-TT - nicht zugeordnet.


Leider ist das mit Paperport nicht möglich. Und sowas wie ELO etc. brauchen wir nicht. Es geht reinweg darum eine PDF Ablage in Ordner zu erstellen.

ich freue mich auf Tipps!
Mitglied: hmarkus
07.04.2013 um 15:12 Uhr
Hallo,

wenn ich Dich richtig verstehe, geht es darum, die Rechnungen einzuscannen als PDF-Dokumente. Diese werden dann umbenannt (nach Rechnungsnummer, Lieferant etc.) und in entsprechende Ordner verschoben.

Ich glaube, wenn Du es effizient von Hand machst, geht es schneller. Ich würde die Rechnungsdateien erstmal mit einem Template umbenennen. Also für kommende Woche alle Rechnungen nach dem Muster
01_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
02_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
03_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
... 
50_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
Dann kannst Du Dir die Dateien als Vorschau im Explorer ansehen und entsprechend umbenennen und dann in Ordner verschieben. Das Umbenennen geht auf diese Weise ziemlich flott. Vielleicht auch mit einem kleinen Batch-Skript.

Es ist auch denkbar, dass Du manuell die Rechnungen nach Lieferanten vorsortierst und benennst.

Da bei OCR eine gewisse Fehlerquote zu berücksichtigen ist, müsstest Du den automatisierten Vorgang sowieso prüfen und dann ist es vielleicht manuell schneller.

Markus
Bitte warten ..
Mitglied: Dustin781
07.04.2013 um 18:58 Uhr
HI,

ggf. hätte ich erwähnen sollen das noch nie was gescannt wurde?
Es sind also rund 3000 Rechnungen die noch gescannt werden müssen.

Die Texterkennung vom Paperport arbeitet Fehlerfrei, und selbst wenn da mal ein Fehler drin ist, das wäre ja nicht dramatisch, das sieht man ja sicher sehr zügig. Da vertippe ich mich glaube ich eher, als das ein Computer nen fehler macht

Auch würden Fehler nicht so viel aus machen, es ist ein Archiv um alle Rechnungen bei Sammen zu haben. sonst sucht man halt immer eweig wenn man etwas braucht.

Gesucht wird meistens nach Datum, da macht das ding keine fehler.


Würde mich freuen, falls jemand noch eine Idee dazu hat!
Bitte warten ..
Mitglied: Lochkartenstanzer
07.04.2013 um 21:17 Uhr
Moin,

Ich würde da vermutlich eine Lösung auf linux.basis "zusammenschrauben"

  • mit einem Kommandozeilen-scantool (scanadf o.ä.) Alle Rechnungen einscannen und unter temporärem Namen ablegen.
  • Aus diesen Scans den betreffenden ausschnitt mit imagemagick ausschneiden und an ein ocr-programm verfüttern, wie z.B. gocr
  • Aus den Ergebnis einen Namen zusammenbasteln und den temporären Scan in das endgültige PDF mit dem richtigen namen umwandeln.

Ist zwar zuviel um das hier einfach so mal aus dem Ärmel zu schütteln, insbesondere weil man nicht weiß, von welchen Programmen/Treibern Euer scanner unterstützt wird, sollte aber für einen Erfahrenen Spezialisten relativ Fix (unter 1/2 MT) zu bewerkstelligen sein.

lks
Bitte warten ..
Mitglied: hmarkus
07.04.2013 um 21:59 Uhr
Hallo nochmal,

ja, an Linux hatte ich auch gedacht

Es ließe sich leicht durch parsen des Textes Lieferant, Rechnungsnummer und Datum sowie Rechnungsbetrag herausfinden. Gerade hab ich mal gocr ausprobiert, danke Lochkartenstanzer für den Tipp

Das Ergebnis scheint von der Scan-Qualität abzuhängen. Für's Parsen würde ich mir in einem solchen Fall ein Perlskript schreiben. Damit kann man dann auch gleich Ordner anlegen, Dateien umbenennen und verschieben.

Markus
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(8)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Batch & Shell
gelöst Dateien mit vorgegebener Größe erstellbar? (3)

Frage von Stefan007 zum Thema Batch & Shell ...

Windows 7
Kopierte Dateien im Hintergrund anzeigen (1)

Frage von MichiBLNN zum Thema Windows 7 ...

Festplatten, SSD, Raid
Reallocated sectors count: Welche Dateien befinden sich in den beschädigten Sektoren? (9)

Frage von DunkleMaterie zum Thema Festplatten, SSD, Raid ...

Heiß diskutierte Inhalte
Microsoft
Ordner mit LW-Buchstaben versehen und benennen (21)

Frage von Xaero1982 zum Thema Microsoft ...

Netzwerkmanagement
gelöst Anregungen, kleiner Betrieb, IT-Umgebung (18)

Frage von Unwichtig zum Thema Netzwerkmanagement ...

Windows Update
Treiberinstallation durch Windows Update läßt sich nicht verhindern (17)

Frage von liquidbase zum Thema Windows Update ...