kkduke
Goto Top

Pdf nach inhalt splitten und benennen

hallo,

ich habe eine pdf datei in der sagen wir mal 10000 rechnungen drin sind (gescannt) und ocr-indexiert. die rechnungen sind alle nach dem gleichen schema aufgebaut. es gibt in einem bestimmten bereich das wort "belegnummer" und dahinter ist eine 10stellige zahl.

ziel ist es aus der einen großen pdf viele kleine zu machen. und zwar soll jede rechnung eine pdf datei bekommen und die pdf soll so heissen wie die rechnungsnummer für die entsprechende seite/datei lautet.

kennt jemand eine möglichkeit dies relativ einfach zu realisieren? bin für jeden tip dankbar.

danke und gruss
kai

Content-Key: 244329

Url: https://administrator.de/contentid/244329

Printed on: April 25, 2024 at 16:04 o'clock

Member: ko81ro
ko81ro Jul 22, 2014 at 09:08:47 (UTC)
Goto Top
Hallo,

such mal nach pdf split and merge...

Grüße
veneue
Member: kkduke
kkduke Jul 22, 2014 at 09:09:47 (UTC)
Goto Top
das kann meines wissens nicht nach ocr-inhalt eine automatische trennung vornehmen. aber ich prüfe es nochmal.
Member: Webfuchs
Webfuchs Jul 22, 2014 at 09:16:23 (UTC)
Goto Top
Member: Lochkartenstanzer
Lochkartenstanzer Jul 22, 2014 at 09:36:11 (UTC)
Goto Top
Hat jede rechnung gelich viele Seiten oder sind diese unterschiedlich lang?

wenn die alle gleich sind, könnte man die einfgach durch die gängigen Splittools auseinanderdividieren udn dann nochmal OCR drüberjagen.

lks
Member: Nr60730
Nr60730 Jul 25, 2014 at 09:13:59 (UTC)
Goto Top
Salü LKS,

Theologisch ist deine Frage doch Jacke wie Hose?

Ich würd da auf jeder seite mittels findstr nach belegnummer suchen und eine Variable setzen - greift das ins leere (weil seite x von y) sollte die Variable noch die Belegnummer der vorherigen Seite verweisen face-wink

Irgendwo hatten wir das doch schonmal mit pdftoolkit gelöst?

Gruß