flabs
Goto Top

PDF Indexierung Anregungen gesucht

Moin miteinander,

ich suche Ideen und Lösungsansätze für folgendes Problem. Ich scanne Schriftstücke / Belege aller Art als PDF/A ein diese sind voll durchsuchbar, das klappt auch wunderbar allerdings wird die Suche mit zunehmender Dateienanzahl im Acrobat Reader über die erweiterte Suche etwas unübersichtlich.

Ich habe schon den Adobe Acrobat getestet, damit lässt sich ein Index aller Dokumente erstellen, ist aber noch nicht optimal und kostet Geld. DocFetcher habe ich auch schon getestet arbeiter aber ähnlich Adobe Reader.

Ich habe mir auch schon diverse Quell offene DMS angesehen aber bei vielen sind die interessanten Features dann doch Lizenzpflichtig.


Ich würde gerne die Dokumente nach dem scannen, wenn in ein DMS dann automatisiert importieren und per OCR Indexieren, damit die Volltext Suche etwas schneller geht.

Welche Ideen habt ihr dazu?


Gruß

Content-Key: 269025

Url: https://administrator.de/contentid/269025

Printed on: April 25, 2024 at 01:04 o'clock

Member: keine-ahnung
keine-ahnung Apr 13, 2015 at 11:40:49 (UTC)
Goto Top
Moin,
ist aber noch nicht optimal und kostet Geld
echt? Da gibt es Leute, die wollen Kohle für Ihre Arbeit?
aber bei vielen sind die interessanten Features dann doch Lizenzpflichtig
Noch mehr? Verrückt ...
Na, wenn es unbedingt für umme sein muss face-wink ...

LG, Thomas
Member: AndiEoh
AndiEoh Apr 13, 2015 at 11:51:32 (UTC)
Goto Top
Hallo,

welches OS denn? Unter Windows gibt es die Möglichkeit per iFilter die Volltext Suche auf PDF Dateien auszuweiten. Das ganze geht über einen Index und sollte auch größere Mengen fix durchsuchen...

Ach so, sind eingescannt. Das sind üblicherweise TIFF mit PDF "Rahmen", dann brauchst du tatsächlich OCR um den Text zu extrahieren, aber das brauchst du IMHO sowieso wenn es PDF/A sein soll.


Gruß

Andi
Member: Lochkartenstanzer
Lochkartenstanzer Apr 13, 2015 updated at 11:55:59 (UTC)
Goto Top
Da gibt es auch etwas bei der ct von heise.

lks