max-powers-2014
Goto Top

Viele Scanner-PDFs in durchsuchbare OCR-PDFs umwandeln automatisch

Hallo,

ich habe mehr als 1000 PDFs hier in verschiedenen Ordnern die ich durchsuchbar machen will.
Nun könnte ich jede einzelne wählen und durch ein OCR Prog. jagen, das kostet aber zu viel Zeit.

Ich würde gerne etwas haben das das macht: "Nimm dir alle PDFs in C:/ vor und mach durchsuchbare PDFs drauß und überschreibe sie"

Gibt es da etwas? Es muss keine Freeware sein...
Danke.

Content-Key: 257921

Url: https://administrator.de/contentid/257921

Printed on: April 25, 2024 at 02:04 o'clock

Member: jhinrichs
jhinrichs Dec 17, 2014 at 15:05:50 (UTC)
Goto Top
Moin,

OmniPage Ultimate kann so etwas.
Die Konkurrenz wahrscheinlich auch.

Viele Grüße
Member: BirdyB
BirdyB Dec 17, 2014 at 18:32:46 (UTC)
Goto Top
Hi,

ich habe soetwas mal unter Linux mit Tesseract-OCR kostenlos bewältigt. Hat ziemlich gut funktioniert...

Gruß!

Berthold
Member: max-powers-2014
max-powers-2014 Dec 18, 2014 at 14:30:19 (UTC)
Goto Top
Hallo jhinrichs,

nach einigen Stunden gefühltem download einer 2 GB Datei und konfiguration geht es nun per Ordnerüberwachung, Danke. face-smile

ABER: Das Problem ist das er sich nur die neuen PDFs vornimmt die in den Ordner kommen, nicht die alten.
Da die alten in sehr vielen (über 1000) unterodnern sind kann ich diese leider unmöglich alle rauslöschen und neu einfügen.
Member: kaiand1
kaiand1 Dec 19, 2014 at 04:06:52 (UTC)
Goto Top
Dann ein Script schreiben das in den Ordner nach PDFs sucht, diese in den Umwandlungsordner verschiebt, wartet bis Umwandlung erfolgt ist, zurückschiebt und in eine DB vermerkt das die Erledigt ist ??