patriot
Goto Top

Ausschnitt eines Epapers als durchsuchbares PDF speichern

Guten Abend zusammen,

ich suche eine Möglichkeit einen Teil eines durchsuchbaren PDF's auszuschneiden und wieder als durchsuchbares PDF zu speichern.
Konkret geht es um Zeitungsausschnitte zu gewissen Themen, die Zeitung besitze ich als PDF ich möchte nun unterschiedliche Ausschnitte fortlaufend exportieren und als durchsuchbares PDF speichern, so soll eine Art Archiv aufgebaut werden, wo dann nach dem jeweiligen Wort gesucht werden kann.

Hat einer eine Idee bzw. Erfahrung dazu, wie ich das angehen könnte?

Vielen Dank schon vorab

Patriot

Content-Key: 354109

Url: https://administrator.de/contentid/354109

Printed on: April 25, 2024 at 05:04 o'clock

Member: Unwissender1
Unwissender1 Nov 08, 2017 at 22:06:41 (UTC)
Goto Top
Hallo.

Das erscheint mir ziemlich einfach.

Nimm den PDF-XChange-Viewer in der Pro-Version. Damit kannst Du Seiten innerhalb eines Gesamt-PDFs extrahieren und in ein anderes PDF-Dokument (hier dein Archiv) einfügen.

Das Programm hat eine eingebaute Suchfunktion und auf Wunsch kannst Du auch noch bestimmte Testpassagen farblich markieren (ähnlich wie ein Textmarker).

Bin seit Jahren sehr zufrieden mit dem Viewer. Gibt aber bestimmt auch kostenlose Programme auf den Markt.

Gruß
Thomas
Member: Patriot
Patriot Nov 09, 2017 at 07:25:16 (UTC)
Goto Top
Hallo Unwissender1,

ich möchte aber nicht eine komplette Seite aus dem GesamtPDF sondern einzelne Artikel aus einer Seite.
Die Seite ist vergleichbar mit einer Leserbriefseite, wo einige Artikel auf einer Seite sind - ich aber nur einen Artikel aus dieser Seite benötige.

Vielen Dank
Member: Unwissender1
Unwissender1 Nov 09, 2017 at 19:25:50 (UTC)
Goto Top
Dann leg doch einen (weißen/schwarzen) Kasten drüber?!

Ein Lösungsansatz, welcher mir aber nicht so gefällt:
Mach einen Screenshot des Artikels (dann ist er nicht mehr durchsuchbar), füge ihn in deinem Archiv-Dokument ein und lass dieses dann OCR-scannen --> dann ist er wieder durchsuchbar. Finde ich aber irgendwie hintenrum.

Warum nicht einfach die Seite komplett lassen. So sieht man wenigstens, aus welcher Zeitschrift/Quelle der Artikel stammt.