needles
Goto Top

Suche eine Software für die Erstellung von durchsuchbaren .pdf - Dateien (große Anzahl).

hi @ all.....

Folgende Situation:

- 60.000 - 70.000 Lokal auf einem Rechner (Win Server 2003) im Netzwerk abgespeicherte .pdf-Dateien
- teilweise sind die .pdf - Dateien schon durchsuchbar, teilweise nicht
- nicht festellbar wieviele .pdf - Dateien nicht durchsuchbar sind
- gut gepflegte Ordnerstruktur mit mehreren Ebenen
- .pdf - Dateien teilweise mit anderen Formaten (z.Bsp. HTML, .txt) in einem Verzeichnis
- tägliche Erweiterung des Datenbestandes, da alle Netzwerkscanner und Mitarbeiter in diesem Verzeichnis die .pdf - Dateien ablegen
- Anzahl der Clients im Netzwerk: ca. 20
- Anzahl der verschiedenen Rechner mit Server Fkt. im Netzwerk: 5
- Betriebssysteme: Win Server 2003, Win XP Pro, Win 7 Pro

Problemstellung:
- erstmal sollen alle bestehenden .pdf - Dateien durchsuchbar gemacht werden
- ganz wichtig: Ordnerstruktur muss beibehalten werden
- später sollen dann alle neu reinkommenden .pdf - Dateien sofort durchsuchbar gemacht werden


Ich habe mich schon bei verschiedensten namhaften Herstellern (Adobe, Abbyy, etc.) erkundigt. Alle bieten in irgend einer Weise eine Lösung an die zwar wunderbar die .pdf - Dateien durchsuchbar macht, allerdings dabei die Daten aus der bestehenden Ordnerstruktur nimmt und sie in einem neuen Verzeichnis ablegt. Letztendlich hat man also nach dem Prozess des durchsuchbar-machens alle 60.000 - 70.000 .pdf - Dateien in einem Verzeichnis liegen und muss sie mühselig in die vorhendene Ordnerstruktur zurück einpflegen, was eigentlich nahezu unmöglich ist.

Ich hoffe deshalb auf dieses wunderbare Forum welches mir schon einige Male weitergeholfen hat.
Solltet ihr noch Fragen zur Infrastruktur haben dann fragt einfach....

Ich danke euch schon mal und freu mich auf Anregungen....

greetz ;)

Content-Key: 147632

Url: https://administrator.de/contentid/147632

Printed on: April 26, 2024 at 08:04 o'clock

Member: Starmanager
Starmanager Jul 26, 2010 at 09:17:19 (UTC)
Goto Top
Hallo,

wir verwenden hier auf den Arbeitsplaetzen Copernic als Suchmaschine. Kann sehr gut mit allen Dokumenten umgehen ist relativ einfach zu bedienen und jeder kann sein Themengebiet abgrenzen. Ist halt eine Client Suchmaschine. (www.copernic.com)

MFG

Starmanager
Member: Der-Phil
Der-Phil Jul 26, 2010 at 09:47:46 (UTC)
Goto Top
Hallo,

kann Copernic denn auch PDFs "durchsuchbar" machen via OCR?

Phil
Member: Starmanager
Starmanager Jul 26, 2010 at 10:00:05 (UTC)
Goto Top
Nein nur fertige PDFs und Office Dokumente durchsuchen. Gibt es als Testverision. Wenn Du PDFs aus OCR erstellen musst brauchst Du eine Software wie z.B. Readiris 12 fuer den Einzelplatz oder eine Loesung die man fuer Kopierer kaufen kann. Wir haben eine solche Loesung zum archivieren. Da wird ein Stapel Dokumente in ein PDF verwandelt und gleichzeitig der Text erkannt. NSI Autostor Express ist eine gute Wahl wenn man es mit dem Kopierer koppeln moechte.

MFG

Starmanager
Member: needles
needles Jul 26, 2010 at 11:54:10 (UTC)
Goto Top
Danke für eure Antworten...

Allerdings haben wir für die Desktop Suche schon eine Lösung im Betrieb.
Es geht bei der Problemstellung lediglich um das durchsuchbar-machen der vorhandenen .pdf - Dateien auf dem zentralen Rechner, damit die einzelnen Arbeitsplätze über das Netzlaufwerk ihre Desktop Suche in dem Umfang auch nutzen können.

Bin dankbar für weitere Anregungen...

;)
Member: Der-Phil
Der-Phil Jul 26, 2010 at 13:26:29 (UTC)
Goto Top
Hallo,

bei neueintreffenden PDFs habe ich keine Idee.
Die bestehenden PDFs kannst Du mit Adobe Acrobat Prof. durchsuchbar machen. Dort kannst Du einen Batch-Job anlegen.

Phil
Member: needles
needles Jul 26, 2010 at 15:57:56 (UTC)
Goto Top
Hi...

Danke dir für die Antwort...

Aber mit Adobe habe ich schon telefoniert. Sämtliche Lösungen die sie anbieten (auch die Serverlösungen) nehmen die .pdf - Dateien aus der bestehenden Ordnerstruktur und schreiben sie in ein neues Verzeichnis.
Und dann aus dem neuen Verzeichnis alle .pdf - Dateien (!! 60.000 - 70.000 !!) wieder zurück in die Originalstruktur schieben (Originale überschreiben)......hmmmm......

Bin dankbar für weitere Anregungen...

greetz ;)
Member: Chivo123
Chivo123 Oct 28, 2021 updated at 11:25:18 (UTC)
Goto Top
Ich bin neu hier und auf der Suche nach einer Batch Konvertierung von PDF auf durchsuchbare PDF hier gelandet. Auch wenn der letzte Beitrag schon eine Weile her ist, habe ich nichts gefunden was meinen Vorstellungen entspricht.
Das Tool sollte in allen vorgegebenen Verzeichnissen und Unterverzeichnissen nach nicht durchsuchbaren PDF`s suchen und diese dann Konvertieren und im selben Ordner ablegen. Scheint immer noch sehr gefragt zu sein, habe aber bis jetzt keine Lösung gefunden.
Mitglied: 149569
149569 Oct 28, 2021 updated at 10:27:18 (UTC)
Goto Top
Acrobat DC =>

Action Wizard --> Recognise Text Using OCR --> Unchecked "Prompt User" --> Set "Default Option" to "Add Folder" so that I could select the folder with all my PDFs --> save tool.

Fertsch.