Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Suche eine Software für die Erstellung von durchsuchbaren .pdf - Dateien (große Anzahl).

Frage Microsoft Microsoft Office

Mitglied: needles

needles (Level 1) - Jetzt verbinden

26.07.2010 um 09:52 Uhr, 7077 Aufrufe, 6 Kommentare

hi @ all.....

Folgende Situation:

- 60.000 - 70.000 Lokal auf einem Rechner (Win Server 2003) im Netzwerk abgespeicherte .pdf-Dateien
- teilweise sind die .pdf - Dateien schon durchsuchbar, teilweise nicht
- nicht festellbar wieviele .pdf - Dateien nicht durchsuchbar sind
- gut gepflegte Ordnerstruktur mit mehreren Ebenen
- .pdf - Dateien teilweise mit anderen Formaten (z.Bsp. HTML, .txt) in einem Verzeichnis
- tägliche Erweiterung des Datenbestandes, da alle Netzwerkscanner und Mitarbeiter in diesem Verzeichnis die .pdf - Dateien ablegen
- Anzahl der Clients im Netzwerk: ca. 20
- Anzahl der verschiedenen Rechner mit Server Fkt. im Netzwerk: 5
- Betriebssysteme: Win Server 2003, Win XP Pro, Win 7 Pro

Problemstellung:
- erstmal sollen alle bestehenden .pdf - Dateien durchsuchbar gemacht werden
- ganz wichtig: Ordnerstruktur muss beibehalten werden
- später sollen dann alle neu reinkommenden .pdf - Dateien sofort durchsuchbar gemacht werden


Ich habe mich schon bei verschiedensten namhaften Herstellern (Adobe, Abbyy, etc.) erkundigt. Alle bieten in irgend einer Weise eine Lösung an die zwar wunderbar die .pdf - Dateien durchsuchbar macht, allerdings dabei die Daten aus der bestehenden Ordnerstruktur nimmt und sie in einem neuen Verzeichnis ablegt. Letztendlich hat man also nach dem Prozess des durchsuchbar-machens alle 60.000 - 70.000 .pdf - Dateien in einem Verzeichnis liegen und muss sie mühselig in die vorhendene Ordnerstruktur zurück einpflegen, was eigentlich nahezu unmöglich ist.

Ich hoffe deshalb auf dieses wunderbare Forum welches mir schon einige Male weitergeholfen hat.
Solltet ihr noch Fragen zur Infrastruktur haben dann fragt einfach....

Ich danke euch schon mal und freu mich auf Anregungen....

greetz ;)
Mitglied: Starmanager
26.07.2010 um 11:17 Uhr
Hallo,

wir verwenden hier auf den Arbeitsplaetzen Copernic als Suchmaschine. Kann sehr gut mit allen Dokumenten umgehen ist relativ einfach zu bedienen und jeder kann sein Themengebiet abgrenzen. Ist halt eine Client Suchmaschine. (www.copernic.com)

Mit freundlichen Grüßen

Starmanager
Bitte warten ..
Mitglied: Der-Phil
26.07.2010 um 11:47 Uhr
Hallo,

kann Copernic denn auch PDFs "durchsuchbar" machen via OCR?

Phil
Bitte warten ..
Mitglied: Starmanager
26.07.2010 um 12:00 Uhr
Nein nur fertige PDFs und Office Dokumente durchsuchen. Gibt es als Testverision. Wenn Du PDFs aus OCR erstellen musst brauchst Du eine Software wie z.B. Readiris 12 fuer den Einzelplatz oder eine Loesung die man fuer Kopierer kaufen kann. Wir haben eine solche Loesung zum archivieren. Da wird ein Stapel Dokumente in ein PDF verwandelt und gleichzeitig der Text erkannt. NSI Autostor Express ist eine gute Wahl wenn man es mit dem Kopierer koppeln moechte.

Mit freundlichen Grüßen

Starmanager
Bitte warten ..
Mitglied: needles
26.07.2010 um 13:54 Uhr
Danke für eure Antworten...

Allerdings haben wir für die Desktop Suche schon eine Lösung im Betrieb.
Es geht bei der Problemstellung lediglich um das durchsuchbar-machen der vorhandenen .pdf - Dateien auf dem zentralen Rechner, damit die einzelnen Arbeitsplätze über das Netzlaufwerk ihre Desktop Suche in dem Umfang auch nutzen können.

Bin dankbar für weitere Anregungen...

;)
Bitte warten ..
Mitglied: Der-Phil
26.07.2010 um 15:26 Uhr
Hallo,

bei neueintreffenden PDFs habe ich keine Idee.
Die bestehenden PDFs kannst Du mit Adobe Acrobat Prof. durchsuchbar machen. Dort kannst Du einen Batch-Job anlegen.

Phil
Bitte warten ..
Mitglied: needles
26.07.2010 um 17:57 Uhr
Hi...

Danke dir für die Antwort...

Aber mit Adobe habe ich schon telefoniert. Sämtliche Lösungen die sie anbieten (auch die Serverlösungen) nehmen die .pdf - Dateien aus der bestehenden Ordnerstruktur und schreiben sie in ein neues Verzeichnis.
Und dann aus dem neuen Verzeichnis alle .pdf - Dateien (!! 60.000 - 70.000 !!) wieder zurück in die Originalstruktur schieben (Originale überschreiben)......hmmmm......

Bin dankbar für weitere Anregungen...

greetz ;)
Bitte warten ..
Neuester Wissensbeitrag
Humor (lol)

Linkliste für Adventskalender

(3)

Information von nikoatit zum Thema Humor (lol) ...

Ähnliche Inhalte
Batch & Shell
gelöst 1 PDF entsprechend der Anzahl duplizieren (5)

Frage von Kalisser zum Thema Batch & Shell ...

Batch & Shell
gelöst Mehrere PDF-Dateien per Batch zusammenfügen (1)

Frage von Grimmli zum Thema Batch & Shell ...

Drucker und Scanner
Problem mit Ausdruck von PDF Dateien (4)

Frage von CountryBoy zum Thema Drucker und Scanner ...

Viren und Trojaner
gelöst "Gefährlichkeit" von PDF-Dateien (8)

Frage von thaefliger zum Thema Viren und Trojaner ...

Heiß diskutierte Inhalte
Windows Server
DHCP Server switchen (25)

Frage von M.Marz zum Thema Windows Server ...

SAN, NAS, DAS
gelöst HP-Proliant Microserver Betriebssystem (14)

Frage von Yannosch zum Thema SAN, NAS, DAS ...

Grafikkarten & Monitore
Win 10 Grafikkarte Crash von Software? (13)

Frage von Marabunta zum Thema Grafikkarten & Monitore ...

Erkennung und -Abwehr
Spam mit eigener Domain (12)

Frage von NoobOne zum Thema Erkennung und -Abwehr ...