Mit PDF Parser Content Splitter in Datenbank schreiben

Hallo, ich habe schon einmal vor wenigen Wochen danach gefragt. Leider hab ich noch nichts passendes gefunden.

Ich suche einen PDF Parser/DMS, der alle PDF Dokumente in einem Ordner durchsucht und anhand eines Splitstrings (ID Nummer) die PDFs Splittet.(Immer wenn sich dieser String auftaucht)
Zudem müssen andere Strings aus den PDFs ausgelesen und in eine Datenbank geschrieben werden.

Ein weiteres Problem sind die unterschiedlichen PDFs die verarbeitet werden, so wäre es sinnvoll wenn der PDF Parser das Parsing Template automatisch auswählen könnte.

Desweiteren müssten auch Informationen aus den zu den PDFs gehörigen emails auch geparst und in eine DB geschrieben werden.

Ich weis das ist recht kompliziert. Aber es wird doch sicherlich irgendein DMS geben das so etwas kann.

Bisher sah meine Lösung so aus das ich mit einem Programm die PDFs runtergeladen habe, sie mit A-PDF Splitter gesplittet und entsprechend benannt habe, dann hab ich mit einem selbst geschriebenem Programm die Informationen aus dem Dateinamen in eine Datenbank geschrieben.

Kann mir da jemand helfen oder etwas empfehlen? Ich wäre sehr dankbar, suche schon sehr lange nach etwas passendem.

Please also mark the comments that contributed to the solution of the article

Content-Key: 328389

Url: https://administrator.de/contentid/328389

Printed on: April 25, 2024 at 12:04 o'clock

1 Comment

Mit ITextsharp und ein wenig Anpassung lässt sich das auch selber machen.

PDF: Alle Seiten entfernen, welche nicht definierten String enthalten

Was fertiges in dieser Art und Weise wirst du nicht finden.

Gruß

German solved Question Other systems

Hotly discussed

Check of ZFW Firewallgleixnerd - 5 Comments

Wireguard VPN on UDM Pro behind Fritzbox - Handshake did not completejstricker - 3 Comments