it-2
Goto Top

TIFF Verarbeitung per Batch mit zerlegung der Seiten

Guten Tag,

ich möchte TIFF Dokumente automatisch archivieren. So weit so gut. Möglich wäre auch PDF.

Jetzt zum Problem:
Ich bekomme eine A4 Seite. Auf dieser sind unterschiedliche Vorgänge. Getrennt durch eine Linie und eine Nummer oben Links.
Jetzt möchte ich das TIFF automatisch in die einzelnen Belege zerlegen um diese dann zu archivieren.
Hat dazu jemand eine Idee?

Gruß,
Nikolas

Content-Key: 324747

Url: https://administrator.de/contentid/324747

Printed on: April 20, 2024 at 03:04 o'clock

Mitglied: 131381
131381 Dec 24, 2016 updated at 17:16:48 (UTC)
Goto Top
Grundgerüste für das Arbeiten mit Multipage-TIFF oder auslesen und Zerlegen von PDF findest du hier
Klar das du hier noch selbst Hand anlegen musst, aber sie bieten dir schon ein Gerüst womit man sowas realisieren kann.
Als Fachinformatiker solltest du damit auf jeden Fall was anfangen können face-wink

Batch ist für sowas heutzutage die schlechteste Wahl ...

Gruß mik
Member: it-2
it-2 Dec 24, 2016 at 21:39:07 (UTC)
Goto Top
Hi Mikrotik,

danke für die Infos. Das mit den PDFs muss ich mit mal genauer ansehen, was die DLL aus dem Post so kann. Aber es geht nicht um Multipage. Es ist nur eine Seite mit mehreren, mehrzeiligen Einträgen. Immer beginnend mit einer Linie von Links nach Rechts und einer Nummer in der nächsten Zeile links.
Ausgabe als PDF/A oder TIFF ist möglich.
Ich muss die Seite dann an der/den Linien auseinander schneiden und als einzelne Seiten speichern. Top wäre die Nummer aus der zweiten Zeile als Dateiname. Das ist aber nur nice to have.

Gruß,
Nikolas
Mitglied: 131381
131381 Dec 24, 2016 updated at 22:13:12 (UTC)
Goto Top
Ohne Beispiel-PDF wird dir hier bestimmt niemand präziser helfen können.
Member: Arano
Arano Dec 25, 2016 at 16:57:05 (UTC)
Goto Top
Hey,

nur eine Idee:
Wenn die Abschnitte immer gleich groß sind, ließe sich das Tiff doch mit z.B. ImageMagic in Einzelteile zerlegen, notfalls ja auch teilweise überlappend um Höhenunterschiede zu kompensieren.

Wegen der Zahlenfolge für den Dateinemen:
OCR aber davon verstehe ich nichts.

Also
convert DATEI.tiff -crope "koords.teil1" DATEINEU-1.tiff  
convert DATEI.tiff -crope "koords.teil2" DATEINEU-2.tiff  
convert DATEI.tiff -crope "koords.teil3" DATEINEU-3.tiff  
Naja, schau lieber hier: http://imagemagick.org/Usage/crop/#crop


~Arano
Member: it-2
it-2 Jan 02, 2017 at 22:34:14 (UTC)
Goto Top
Hallo Arano,

entschuldige die späte Antwort. Ich war die letzten Tage mit dem neuen Projekt Sohnemann 1.0 beschäftigt face-wink

Leider sind die Koordinaten immer Variabel.
Das sind belege für die Auslieferung beim Kunden. Je nach dem wie viel Pakete in der Sendung waren, ist der jeweilige Abschnitt länger oder kürzer. Nach jedem Kunden kommt ein "Balken" von links nach rechts auf der Seite. Ich hatte gehofft, das es da irgendwas wie OCR gibt...

Gruß,
Nikolas
Mitglied: 131381
131381 Jan 03, 2017 updated at 08:06:58 (UTC)
Goto Top
Wie gesagt, poste ein Beispiel-PDF dann kann man dir auch helfen! Ohne den exakten Aufbau zu kennen wird das hier nichts.
Mitglied: 131381
131381 Jan 04, 2017 updated at 09:38:36 (UTC)
Goto Top
Kommt hier noch was oder willst du keine Hilfe weil du nicht auf meine Frage antwortest?? Ich könnte dir definitiv helfen wenn mir ein Beispiel Tiff vorläge, sensitives kannst du ja schwärzen.
Ich kann z.B. per Powershell vertikal die Pixel analysieren und so die Trennstriche erkennen und die Bilder passend zurechtschneiden, kein Problem also, nur ist es dazu eben nötig zumindest eine grobe Vorlage vorliegen zu haben.