Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Suche eine Software für die Erstellung von durchsuchbaren .pdf - Dateien (große Anzahl).

Mitglied: needles

needles (Level 1) - Jetzt verbinden

26.07.2010 um 09:52 Uhr, 7243 Aufrufe, 6 Kommentare

hi @ all.....

Folgende Situation:

- 60.000 - 70.000 Lokal auf einem Rechner (Win Server 2003) im Netzwerk abgespeicherte .pdf-Dateien
- teilweise sind die .pdf - Dateien schon durchsuchbar, teilweise nicht
- nicht festellbar wieviele .pdf - Dateien nicht durchsuchbar sind
- gut gepflegte Ordnerstruktur mit mehreren Ebenen
- .pdf - Dateien teilweise mit anderen Formaten (z.Bsp. HTML, .txt) in einem Verzeichnis
- tägliche Erweiterung des Datenbestandes, da alle Netzwerkscanner und Mitarbeiter in diesem Verzeichnis die .pdf - Dateien ablegen
- Anzahl der Clients im Netzwerk: ca. 20
- Anzahl der verschiedenen Rechner mit Server Fkt. im Netzwerk: 5
- Betriebssysteme: Win Server 2003, Win XP Pro, Win 7 Pro

Problemstellung:
- erstmal sollen alle bestehenden .pdf - Dateien durchsuchbar gemacht werden
- ganz wichtig: Ordnerstruktur muss beibehalten werden
- später sollen dann alle neu reinkommenden .pdf - Dateien sofort durchsuchbar gemacht werden


Ich habe mich schon bei verschiedensten namhaften Herstellern (Adobe, Abbyy, etc.) erkundigt. Alle bieten in irgend einer Weise eine Lösung an die zwar wunderbar die .pdf - Dateien durchsuchbar macht, allerdings dabei die Daten aus der bestehenden Ordnerstruktur nimmt und sie in einem neuen Verzeichnis ablegt. Letztendlich hat man also nach dem Prozess des durchsuchbar-machens alle 60.000 - 70.000 .pdf - Dateien in einem Verzeichnis liegen und muss sie mühselig in die vorhendene Ordnerstruktur zurück einpflegen, was eigentlich nahezu unmöglich ist.

Ich hoffe deshalb auf dieses wunderbare Forum welches mir schon einige Male weitergeholfen hat.
Solltet ihr noch Fragen zur Infrastruktur haben dann fragt einfach....

Ich danke euch schon mal und freu mich auf Anregungen....

greetz ;)
Mitglied: Starmanager
26.07.2010 um 11:17 Uhr
Hallo,

wir verwenden hier auf den Arbeitsplaetzen Copernic als Suchmaschine. Kann sehr gut mit allen Dokumenten umgehen ist relativ einfach zu bedienen und jeder kann sein Themengebiet abgrenzen. Ist halt eine Client Suchmaschine. (www.copernic.com)

MFG

Starmanager
Bitte warten ..
Mitglied: Der-Phil
26.07.2010 um 11:47 Uhr
Hallo,

kann Copernic denn auch PDFs "durchsuchbar" machen via OCR?

Phil
Bitte warten ..
Mitglied: Starmanager
26.07.2010 um 12:00 Uhr
Nein nur fertige PDFs und Office Dokumente durchsuchen. Gibt es als Testverision. Wenn Du PDFs aus OCR erstellen musst brauchst Du eine Software wie z.B. Readiris 12 fuer den Einzelplatz oder eine Loesung die man fuer Kopierer kaufen kann. Wir haben eine solche Loesung zum archivieren. Da wird ein Stapel Dokumente in ein PDF verwandelt und gleichzeitig der Text erkannt. NSI Autostor Express ist eine gute Wahl wenn man es mit dem Kopierer koppeln moechte.

MFG

Starmanager
Bitte warten ..
Mitglied: needles
26.07.2010 um 13:54 Uhr
Danke für eure Antworten...

Allerdings haben wir für die Desktop Suche schon eine Lösung im Betrieb.
Es geht bei der Problemstellung lediglich um das durchsuchbar-machen der vorhandenen .pdf - Dateien auf dem zentralen Rechner, damit die einzelnen Arbeitsplätze über das Netzlaufwerk ihre Desktop Suche in dem Umfang auch nutzen können.

Bin dankbar für weitere Anregungen...

;)
Bitte warten ..
Mitglied: Der-Phil
26.07.2010 um 15:26 Uhr
Hallo,

bei neueintreffenden PDFs habe ich keine Idee.
Die bestehenden PDFs kannst Du mit Adobe Acrobat Prof. durchsuchbar machen. Dort kannst Du einen Batch-Job anlegen.

Phil
Bitte warten ..
Mitglied: needles
26.07.2010 um 17:57 Uhr
Hi...

Danke dir für die Antwort...

Aber mit Adobe habe ich schon telefoniert. Sämtliche Lösungen die sie anbieten (auch die Serverlösungen) nehmen die .pdf - Dateien aus der bestehenden Ordnerstruktur und schreiben sie in ein neues Verzeichnis.
Und dann aus dem neuen Verzeichnis alle .pdf - Dateien (!! 60.000 - 70.000 !!) wieder zurück in die Originalstruktur schieben (Originale überschreiben)......hmmmm......

Bin dankbar für weitere Anregungen...

greetz ;)
Bitte warten ..
Ähnliche Inhalte
Grafik

Gescanntes PDF in ein durchsuchbares PDF umwandeln

Frage von FalaffelGrafik10 Kommentare

Hallo, ich suche eine Möglichkeit gescannte PDFs komfortabel in durchsuchbare PDFs umzuwandeln. Die PDFs kommen von A3-Kopierern direkt in ...

Windows 10

Suche ein Programm um PDF durchsuchbar zu machen ggf. automatisch

Frage von thomasmuhWindows 109 Kommentare

Hallo liebe Forum Mitglieder ich bin auf der suche nach einem Programm was aus einer PDF Datei eine durchsuchbare ...

Schriftarten

Ausschnitt eines Epapers als durchsuchbares PDF speichern

Frage von PatriotSchriftarten3 Kommentare

Guten Abend zusammen, ich suche eine Möglichkeit einen Teil eines durchsuchbaren PDF's auszuschneiden und wieder als durchsuchbares PDF zu ...

Multimedia

Papierarmes Büro - Scanner am Arbeitsplatz in durchsuchbare PDFs

gelöst Frage von Der-PhilMultimedia13 Kommentare

Hallo! Ich würde gerne die Papierflut im Büro etwas eindämmen. Was mir hier weiterhin zu kompliziert ist, ist das ...

Neue Wissensbeiträge
iOS
IOS 11.2.6 verfügbar
Information von sabines vor 4 StundeniOS

Mit dem Update soll der Bug behoben werden, bei dem eine bestimmte Zeichenkette IOS zum Absturz gebracht hat.

Sicherheit
Sicherheitsrisiko: Die Krux mit 7-Zip
Information von kgborn vor 18 StundenSicherheit2 Kommentare

Bei vielen Anwendern ist das Tool 7-Zip zum Entpacken von Archivdateien im Einsatz. Die Software ist kostenlos und steht ...

Internet

Datendealing im WWW Tracking Methoden immer brutaler

Information von sabines vor 1 TagInternet

Interessanter Artikel zum Thema Tracking im WWW und die immer "besseren" Methoden des Trackings. Professor Arvind Narayanan (Princeton-Universität) betreibt ...

Erkennung und -Abwehr

Ups: Einfaches Nullzeichen hebelte den Anti-Malware-Schutzt in Windows 10 aus

Information von kgborn vor 1 TagErkennung und -Abwehr

Windows 10 ist das sicherste Windows aller Zeiten, wie Microsoft betont. Insidern ist aber klar, das es da Lücken, ...

Heiß diskutierte Inhalte
Server
Route-Befehl Unterstützung (unter CMD)
gelöst Frage von FKRR56Server38 Kommentare

Guten Tag , i.M. habe ich Probleme über den CMD-Route-Befehl ein Routing auf einen entfernten Server zuzulassen. Der Server ...

LAN, WAN, Wireless
VPN Cisco ASA5505 PaloAlto PA-200
gelöst Frage von YannoschLAN, WAN, Wireless19 Kommentare

Hallo zusammen, ich würde gerne ein Site-to-Site VPN zwischen den beiden Standorten aufbauen. PaloAlto PA200 Internetanschluss Deutsche Telekom GK ...

Microsoft
TV-Tipp: Das Microsoft-Dilemma
Information von kgbornMicrosoft17 Kommentare

Aktuell gibt es in Behörden und in Firmen eine fatale Abhängigkeit von Microsoft und dessen Produkten. Planlos agieren die ...

Server-Hardware
Server für Exchange 2016, Kaufberatung
Frage von MazenauerServer-Hardware15 Kommentare

Guten Tag werte Gemeinde, Vorab: Ich dachte es gab mal einen separaten Bereich für solche Anfragen, habe ich leider ...