ahstax
Goto Top

Mit vb.net PDF in Word-Dok einfügen

Hallo,

Ich suche Hinweise und Beispiele, wie man mit einem vb.net-Programm alle Seiten eines PDF-Doks in ein Word-Dok einfügen kann.

Ich freue mich auf Anregungen.

Neugierige Grüße,
Andreas

Content-Key: 329959

Url: https://administrator.de/contentid/329959

Ausgedruckt am: 19.03.2024 um 02:03 Uhr

Mitglied: StefanKittel
StefanKittel 20.02.2017 aktualisiert um 08:46:35 Uhr
Goto Top
Moin,

kann Dein Word das denn von Hand?
Meines nicht. Also wird es auch mit vb nicht gehen.

Du benötigst eine OCR-Software welches ein PDF in ein Bild oder Word-Dokument umwandeln.
Alternativ auch Webseiten oder Programm (Irfanview, Gimp) die PDF-Dateien in Grafiken umwandeln können.

Erst dann kommt VB ins Spiel.

Stefan
Mitglied: emeriks
emeriks 20.02.2017 um 07:31:58 Uhr
Goto Top
Sehe ich auch so.

E.
Mitglied: Kraemer
Kraemer 20.02.2017 um 08:01:07 Uhr
Goto Top
Moin,

mit fällt dazu nur eine Lösung ein: Man nimmt ein Programm wir Irfanview, mit dem man PDF-Dateien in jpeg umwandeln kann, und bindet die Grafikdateien dann in ein Worddokument ein.
Mir erschließt sich nur der Sinn dahinter nicht - was willst du am Ende erreichen?

Gruß Krämer
Mitglied: 132272
132272 20.02.2017 aktualisiert um 09:05:18 Uhr
Goto Top
Wenn Acrobat installiert ist, nicht viel Aufwand, das lässt sich per COM steuern.
Mit dem kostenlosen iTextSharp (dll) und entsprechendem Aufwand ginge das auch.
Nur die Ergebnisse sind meistens unter aller Sau.
Abbyy Finereader erzielt z.B. ansprechende Ergebnisse, aber wenn es an die Nachbearbeitung in Word selber geht kann das schon mal die kuriosesten Effekte haben, denn die Umsetzung der Formatierung ist meist mit Absatz und Zeichenformatierungen Wild durcheinander gewürfelt, was meistens langwierige Nachbearbeitung erfordert um ein einheitliches Dokument zu erhalten.

Gruß
Mitglied: ahstax
ahstax 20.02.2017 um 09:14:36 Uhr
Goto Top
Vielen Dank für Eure Antworten.

Ich habe befürchtet, dass es nicht so einfach geht. Dabei hätten die PDF-Seiten in Word noch nicht mal bearbeitbar sein sollen. Lediglich die Grafikinformation, also ein "Foto", sollte rein.
Vielleicht finde ich ja einen Weg die PDF-Dateien zu splitten, in Grafikdateien zu wandeln und das dann in Word einzufügen. Das wäre wohl ein Kondensat aus Euren Vorschlägen...
Mitglied: 132272
132272 20.02.2017 aktualisiert um 09:34:48 Uhr
Goto Top
iTextsharp kann das und ist bequem als Managed .NET DLL in dein Projekt einbindbar. face-wink
Mitglied: SachsenHessi
SachsenHessi 20.02.2017 aktualisiert um 16:15:31 Uhr
Goto Top
Hallo,

wie so immer im Leben, "Es kommt darauf an" face-smile
Also die "neueren" Word versionen können PDF lesen.
Vorgehen daher:
- Wordobjekt bilden
- mit dem Wordobjekt PDF importieren
- Wordobjekt mit dem anderen Wordobjekt zusammenfügen

ABER Pdf ist nur ein Containerformat. Dar Text sollte auch als TextObjekt im PDF vorhanden sein.
Ist es ein BildObjekt kannst Du nur hoffen, dass die integrierte OCR von Word das beim Import hinkriegt. Sonst wird es als Bild importiert.
Am besten einfach mal "händisch" probieren: Word starten --> Datei öffnen --> PDF wählen

(Ach so, du brauchst dazu bei .NET die Interop-Klassen von Office.)

Gruss
SH
Mitglied: ahstax
ahstax 22.02.2017 um 09:56:24 Uhr
Goto Top
Herzlichen Dank für Eure Hinweise!

Ich habe es so gemacht, wie oben geschrieben. Nicht zwingend elegant (eher hemdsärmelig...), aber es funktioniert...
Mitglied: Kraemer
Kraemer 22.02.2017 um 11:14:39 Uhr
Goto Top
Zitat von @ahstax:

Herzlichen Dank für Eure Hinweise!

Ich habe es so gemacht, wie oben geschrieben. Nicht zwingend elegant (eher hemdsärmelig...), aber es funktioniert...
Hättest du den entsprechenden Beitrag als Lösung markiert, müsste man jetzt nicht raten, wie du das umgesetzt hast.
Mitglied: ahstax
ahstax 22.02.2017 um 12:43:58 Uhr
Goto Top
Da es kein einzelner Beitrag war und unter dem Strich auch nirgends wirklich beschrieben ist, was ich tatsächlich gemacht habe, kann ich die Lösungsteile und einzelnen Anregungen nicht als Lösung markieren.

Mein Weg ist:
  • Umwandeln der PDF-Datei mit n Seiten in n TIFF-Dateien mit Hilfe von Ghostscript
  • Einfügen der n TIFF-Dateien in Word (inlineshape)
  • Umwandeln der Word-Datei in eine PDF-Datei unter Anwendung eines PDF-Converters (ich weiß, geht auch anders, ist hier aber leider notwendig, genau diesen PDF-Converter zu verwenden)
  • Die Dateinamen werden via Commandline-Args übergeben

Herzliche Grüße,
Andreas