Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Scannen mit Texterkennung und Automatischer Benennung von Dateien

Frage Microsoft Microsoft Office

Mitglied: Dustin781

Dustin781 (Level 1) - Jetzt verbinden

07.04.2013 um 12:09 Uhr, 5827 Aufrufe, 4 Kommentare

Ich suche ein Programm, was einscannt und die gescannten Dateien (normal nur Rechnungen) benennt.

Hallo,

wir bekommen in der Firma Pro Woche ca. 50 Rechnungen von 5 Lieferanten.

Also relativ übersichtlich.

Nun hätte ich gerne ein Programm, wo ich einfach den Stapel Rechnungen auf meinen Einzahlblatt-USB-Twain-Kompatiblen Scanner legen und das Zeug mit Texterkennung durch laufen lassen kann.


Da bei den Rechnungen steht immer alles ein gleicher Stelle, damit könnte man perfekterweise die Dateien Automatisch Bennen lassen.

Einige Rechnungen haben auch mehr als eine Seite, diese sind aber immer numeriert.


z.B.
JJJJ-MM-TT Lieferant - Rechnungsnummer - Summe.pdf

Davon 5 verschiedene

und natürlich
JJJJ-MM-TT - nicht zugeordnet.


Leider ist das mit Paperport nicht möglich. Und sowas wie ELO etc. brauchen wir nicht. Es geht reinweg darum eine PDF Ablage in Ordner zu erstellen.

ich freue mich auf Tipps!
Mitglied: hmarkus
07.04.2013 um 15:12 Uhr
Hallo,

wenn ich Dich richtig verstehe, geht es darum, die Rechnungen einzuscannen als PDF-Dokumente. Diese werden dann umbenannt (nach Rechnungsnummer, Lieferant etc.) und in entsprechende Ordner verschoben.

Ich glaube, wenn Du es effizient von Hand machst, geht es schneller. Ich würde die Rechnungsdateien erstmal mit einem Template umbenennen. Also für kommende Woche alle Rechnungen nach dem Muster
01_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
02_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
03_2013-04-08_Lieferant-ReNr-000.00Euro.pdf 
... 
50_2013-04-08_Lieferant-ReNr-000.00Euro.pdf
Dann kannst Du Dir die Dateien als Vorschau im Explorer ansehen und entsprechend umbenennen und dann in Ordner verschieben. Das Umbenennen geht auf diese Weise ziemlich flott. Vielleicht auch mit einem kleinen Batch-Skript.

Es ist auch denkbar, dass Du manuell die Rechnungen nach Lieferanten vorsortierst und benennst.

Da bei OCR eine gewisse Fehlerquote zu berücksichtigen ist, müsstest Du den automatisierten Vorgang sowieso prüfen und dann ist es vielleicht manuell schneller.

Markus
Bitte warten ..
Mitglied: Dustin781
07.04.2013 um 18:58 Uhr
HI,

ggf. hätte ich erwähnen sollen das noch nie was gescannt wurde?
Es sind also rund 3000 Rechnungen die noch gescannt werden müssen.

Die Texterkennung vom Paperport arbeitet Fehlerfrei, und selbst wenn da mal ein Fehler drin ist, das wäre ja nicht dramatisch, das sieht man ja sicher sehr zügig. Da vertippe ich mich glaube ich eher, als das ein Computer nen fehler macht

Auch würden Fehler nicht so viel aus machen, es ist ein Archiv um alle Rechnungen bei Sammen zu haben. sonst sucht man halt immer eweig wenn man etwas braucht.

Gesucht wird meistens nach Datum, da macht das ding keine fehler.


Würde mich freuen, falls jemand noch eine Idee dazu hat!
Bitte warten ..
Mitglied: Lochkartenstanzer
07.04.2013 um 21:17 Uhr
Moin,

Ich würde da vermutlich eine Lösung auf linux.basis "zusammenschrauben"

  • mit einem Kommandozeilen-scantool (scanadf o.ä.) Alle Rechnungen einscannen und unter temporärem Namen ablegen.
  • Aus diesen Scans den betreffenden ausschnitt mit imagemagick ausschneiden und an ein ocr-programm verfüttern, wie z.B. gocr
  • Aus den Ergebnis einen Namen zusammenbasteln und den temporären Scan in das endgültige PDF mit dem richtigen namen umwandeln.

Ist zwar zuviel um das hier einfach so mal aus dem Ärmel zu schütteln, insbesondere weil man nicht weiß, von welchen Programmen/Treibern Euer scanner unterstützt wird, sollte aber für einen Erfahrenen Spezialisten relativ Fix (unter 1/2 MT) zu bewerkstelligen sein.

lks
Bitte warten ..
Mitglied: hmarkus
07.04.2013 um 21:59 Uhr
Hallo nochmal,

ja, an Linux hatte ich auch gedacht

Es ließe sich leicht durch parsen des Textes Lieferant, Rechnungsnummer und Datum sowie Rechnungsbetrag herausfinden. Gerade hab ich mal gocr ausprobiert, danke Lochkartenstanzer für den Tipp

Das Ergebnis scheint von der Scan-Qualität abzuhängen. Für's Parsen würde ich mir in einem solchen Fall ein Perlskript schreiben. Damit kann man dann auch gleich Ordner anlegen, Dateien umbenennen und verschieben.

Markus
Bitte warten ..
Ähnliche Inhalte
Datenbanken
gelöst SQL-Dateien sortieren, kombinieren und filtern (6)

Frage von derapfelsaft zum Thema Datenbanken ...

Windows 7
Temporäre Dateien im Profilordner belegen mehrere 100 GB (6)

Frage von sirhc4022 zum Thema Windows 7 ...

Neue Wissensbeiträge
Windows 10

Windows 8.x oder 10 Lizenz-Key aus dem ROM auslesen mit Linux

(6)

Tipp von Lochkartenstanzer zum Thema Windows 10 ...

Tipps & Tricks

Wie Hackt man sich am besten in ein Computernetzwerk ein

(40)

Erfahrungsbericht von Herbrich19 zum Thema Tipps & Tricks ...

Heiß diskutierte Inhalte
Windows 10
gelöst Windows 10 Home "Netzlaufwerk nicht bereit" (19)

Frage von Oggy01 zum Thema Windows 10 ...

Exchange Server
gelöst RU 17 Exchange 2010 . Erfahrungen? (10)

Frage von keine-ahnung zum Thema Exchange Server ...

Datenbanken
gelöst MySQL Zeiterfassungs-Problematik (wer ist eingecheckt) (9)

Frage von NativeMode zum Thema Datenbanken ...

Windows Server
Festplatten Ruhezustand Windows Server 2016 (8)

Frage von ahaeuser zum Thema Windows Server ...