103148
Goto Top

PDF Dokument auswerten bzw bearbeiten

Hallo,

wir haben ein PDF Dokument, welches ich auf Einträge prüfen möchte.
Genau gesagt, gibt es einen Eintrag in einer Zeile, wenn nicht muss ein Zähler hochlaufen.

Also jede Zeile prüfen, kein Eintrag, merken und am Ende benötige ich wieviele Zeile da keinen Eintrag haben.
Dieser Wert muss von einer Zahl im Dokument abgezogen werden.

zb links oben steht 189 dann minus der geprüften "nicht Einträge"...

Content-Key: 187515

Url: https://administrator.de/contentid/187515

Printed on: April 25, 2024 at 21:04 o'clock

Member: ratzla
ratzla Jul 16, 2012 at 20:15:12 (UTC)
Goto Top
Vorausgesetzt Dein Dokument ist nicht verschlüsselt, kannst Du in erster Stufe dein Dokument mit pdftotext (Bestandteil der XPDF-Utils [Linux!]) in ein Textdokument umwandeln. Dieses kannst Du dann weiter analysieren (z.b. mit grep).
Sicherlich gibt's auch für Win ähnliche Programme.
Notfalls kannst Du mit Libre/OpenOffice das PDF importieren und darin weiterverarbeiten.

Direkt im PDF gehts prinzipiell auch, aber das ist ziemlich hässlich, da im Minimalfall mindestens der Zeichensatz dekodiert werden müsste (meist noch mehr).

Grüße
Ratzla