Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Webseite als PDF speichern

Frage Internet Utilities

Mitglied: Festus94

Festus94 (Level 1) - Jetzt verbinden

25.12.2013 um 22:06 Uhr, 4693 Aufrufe, 17 Kommentare

Hallo zusammen,

seit einiger Zeit versuche ich erfolglos, beliebige Webseiten 1:1 als PDF-Dokument abzuspeichern (zur Klarheit: Ich rede von einer einzelnen Seite, nicht von einem ganzen Online-Auftritt.). Vom Prinzip her ist das ja kein Problem. Zum Beispiel habe ich den Adobe PDF-Drucker installiert. Ich habe gerade mal Administrator.de damit gedruckt. Das Ergebnis ist wie immer mehr als beschämend:


99ada7e666d3fc913aac6a36092d16fb - Klicke auf das Bild, um es zu vergrößern


Dass das Problem in der voreingestellten "Papiergröße" A4 liegt, ist mir einleuchtend, aber ich möchte, dass die PDF eben genau so breit und hoch ist, wie es die Homepage auch ist. Erstens weiß ich nicht, wie breit die Homepage tatsächlich ist, und zweitens habe ich keine Lust, jedes Mal die Einstellungen anpassen zu müssen.

Kennt Ihr ein Programm, was in der Lage ist, mein Vorhaben umzusetzen? Obwohl ich denke, dass mein Vorhaben nicht wirklich weltfremd ist, habe ich leider keine passende Software gefunden. Dass der Adobe PDF-Drucker nicht dafür entwickelt wurde, ist klar, aber es muss doch ein passendes Tool geben...

Für Vorschläge jeglicher Art wäre ich sehr dankbar.


Viele Grüße, und einen schönen letzten Weihnachtstag!

tbnwadm
Mitglied: TheAndy
LÖSUNG 25.12.2013, aktualisiert 26.12.2013
Das mit der Breite von einer Homepage ist so ne Sache, weil viele Webmaster ihre Seiten so erstellen, dass sie dynamisch an vielen Bildschirmauflösungen funktionieren. Wenn du die Breite in deinem Programm einstellen kannst, würde ich 1024px nehmen, die meisten Seiten sind darauf optimiert. Vielleicht hilft auch schon A4 Querformat, aber das ist mehr ein Walkaround und keine wirkliche Lösung für dein Problem.

Frohe Weihnachten,
Andy
Bitte warten ..
Mitglied: Festus94
25.12.2013 um 23:07 Uhr
Hi Andy,

diesen Effekt habe ich auch schon beobachtet. Ich habe in der PDF dann die Handy-Version der Homepage gehabt. Dass die Webseitenbreite ein Problem ist, verstehe ich, aber im Prinzip muss man doch nur die Breite des äußersten Containers übernehmen. Klar kann ich einfach einen höheren Wert für die Breite eintragen, aber erstens muss ich das bei der Höhe dann auch machen (und die ist ja wirklich immer verschieden) und zweitens habe ich dann viel weiße Fläche.

Am Liebsten wäre mir tatsächlich 1:1.

Dir auch frohe Weihnachten!


tbnwadm
Bitte warten ..
Mitglied: colinardo
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Hallo Andy,
ich nutze für solche Fälle SnagIt. Dort habe ich mir ein Profil angelegt welches die ganze Seite captured, die Seite auf die Seitenbreite von A4 skaliert und an den PDF-Drucker sendet. Das ganze geht vollautomatisch, nur die "Druck"-Taste betätigen, in die Seite klicken, fertig.
Frohe Weihnachten
Ebenso
Grüße Uwe
Bitte warten ..
Mitglied: Lochkartenstanzer
LÖSUNG 26.12.2013, aktualisiert um 17:04 Uhr
Moin,

Im Prinzip kann man das Poblem mit Browser-Druckvorschau und PDF-Drucker erschlagen.

z.b. in Mozilla einfach ind er Druckvorschau die Skalierung passen wählen und dann soltle es einigermaße vernünftig aussehen.

buon natale

lks
Bitte warten ..
Mitglied: Driver401
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
"Print Pages to PDF" ist ein Addon für Firefox - und es sollte genau Deine Wünsche erfüllen. Zumindest erstellt es die PDF's genauso wie sie am Bildschirm angezeigt werden - und es ist noch dazu einfach zu bedienen, so dass ich das sogar einigen meiner User schon installiert habe.
http://pp2pdf.tipido.net/index.php/en/convert_actual_page.html

Probiers aus.

Weihnachtsgruß
Jürgen
Bitte warten ..
Mitglied: Festus94
26.12.2013, aktualisiert um 13:32 Uhr
Hallo zusammen,

danke für Eure Hilfe!

@ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses Vorhaben.

@ LKS: Das wäre dann aber auch nur grob, und wenn die Seite eigene Style-Vorgaben für Drucker vorgibt, funktioniert es auch nicht, oder?

@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs. Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

Ich wünsche noch einen schönen Weihnachtstag!


Grüße
tbnwadm
Bitte warten ..
Mitglied: Driver401
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Zitat von Festus94:
@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.

kein Kommentar dazu

Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die
ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

da kann man schon einiges einstellen - aber das hat sich dann ja sowieso für Dich erübrigt


weihnachtliche Grüße
Jürgen
Bitte warten ..
Mitglied: Festus94
26.12.2013 um 13:37 Uhr
Zitat von Driver401:

> Zitat von Festus94:
> @ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.

kein Kommentar dazu

Seit Version 9 bin ich wieder beim IE, da der FF seit Version 14 immer langsamer wurde, und hinterher mehr Zeit gekostet, als Freude gebracht hat. Und bei Version 10/11 des IE kann man echt nicht meckern.

Zitat von Driver401:

> Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

da kann man schon einiges einstellen - aber das hat sich dann ja sowieso für Dich erübrigt


weihnachtliche Grüße
Jürgen

Danke trotzdem.


VG
tbnwadm
Bitte warten ..
Mitglied: colinardo
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Zitat von Festus94:
@ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich
möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses
Vorhaben.
Habe das genommen weil ich's sowieso auf meinem Rechner drauf hab. Bei Snagit lässt sich nur der eigentliche Inhalt der Webseite automatisch inklusive Scrolling aufnehmen, dabei bleibt die Webseite so wie sie dargestellt wird, der Rest des Desktop wird selbstverständlich ignoriert. Für den Preis bietet es halt noch wesentlich mehr, aber das muss jeder selber entscheiden. Testversion ziehen und selber eine Meinung bilden

Grüße Uwe
Bitte warten ..
Mitglied: Festus94
26.12.2013 um 13:51 Uhr
Alles klar, dann werd' ich's mir mal ansehen, danke.

Aber trotzdem kann ich mich irgendwie nicht so ganz damit anfreunden, für so ein simples Vorhaben groß ein Programm kaufen zu müssen...


Grüße
tbnwadm
Bitte warten ..
Mitglied: Lochkartenstanzer
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Zitat von Festus94:

Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet.

Du unterliegst dem Irrtum, daß es sowas wie ein default-Ansicht einer Webseite gibt. Die gibt es nicht. weil jeder renderer (oder browser) seine eigene Sicht hat wie eine Webseite auszusehen hat, und das zusätzlich noch abhängigvon der Bildschirmgröße. Jedes Add-on kann das layout auch noch zusätzlich verändern, so daß im Endeffekt die Webseite zig verschiedene Darstellugen hat.

Woher soll ein programm XY nun wissen, welches die für Dich richtige einstellung ist?

Was Du brauchts ist im Prinzip ein programm, daß die Seite genau so rendert, wie sie Dein Browser darstellt udn das dann in ein PDF wandelt. Damit landen wir wieder genau beim Browser: Du brauchst also ein Add-on, daß den Render-Puffer des browsers ausliest und "druckt" oder du nimmst einfach die Druckfunktion Deines Drowsers, wenn Du nich tmirt Screenshots arbeiten willst.

lks
Bitte warten ..
Mitglied: Festus94
26.12.2013 um 15:11 Uhr
Zitat von Lochkartenstanzer:

> Zitat von Festus94:
>
> Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet.

Du unterliegst dem Irrtum, daß es sowas wie ein default-Ansicht einer Webseite gibt. Die gibt es nicht. weil jeder renderer
(oder browser) seine eigene Sicht hat wie eine Webseite auszusehen hat, und das zusätzlich noch abhängigvon der
Bildschirmgröße. Jedes Add-on kann das layout auch noch zusätzlich verändern, so daß im Endeffekt die
Webseite zig verschiedene Darstellugen hat.

Hi LKS,

da hast Du Recht, aber ist es nicht so, dass es bei jeder Seite eine maximale Breite gibt? Wenn ich mit zum Beispiel eine Seite ansehe, die von mir aus mit Bootstrap erstellt wurde, dann ist die "größte Form" dieser Seite üblicherweise bei 1200px in der Breite. So eine "größte Variante" gibt es doch im Prinzip immer, oder irre ich da? Außerdem bliebe ja noch das Problem, dass die Höhe immer variiert.

Zitat von Lochkartenstanzer:

Woher soll ein programm XY nun wissen, welches die für Dich richtige einstellung ist?

Was Du brauchts ist im Prinzip ein programm, daß die Seite genau so rendert, wie sie Dein Browser darstellt udn das dann in
ein PDF wandelt. Damit landen wir wieder genau beim Browser: Du brauchst also ein Add-on, daß den Render-Puffer des browsers
ausliest und "druckt" oder du nimmst einfach die Druckfunktion Deines Drowsers, wenn Du nich tmirt Screenshots arbeiten
willst.

Genau. In der Regel wird ja dann auf die IE-Engine zurückgegriffen, da sie den Programmierern die entsprechenden Schnittstellen bietet. Im Prinzip kann ich ja mit der Druckfunktion arbeiten, aber dann bräuchte ich eine Möglichkeit, genau Breite und Höhe der Seite auszulesen. Dann müsste ich zum Beispiel beim Adobe PDF-Drucker jedes Mal die Werte anpassen.

Gibt es denn eine einfache Möglichkeit, die "Maße" einer Seite auszulesen, ohne den halben Quelltext auseinanderzunehmen?

Danke für Eure Hilfe!


tbnwadm
Bitte warten ..
Mitglied: Lochkartenstanzer
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Zitat von Festus94:
So eine "größte Variante" gibt es doch im Prinzip immer,

Nein (abhängig von der Webseite natürlich)

oder irre ich da?

Ja

Genau. In der Regel wird ja dann auf die IE-Engine zurückgegriffen, da sie den Programmierern die entsprechenden
Schnittstellen bietet.

Das Problem ist aber, welche Paramter (z.b. Darstellungsbreite) der Engine übergeben werden. Die kann aber durchaus von Deiner Bildschirmdarstellung abweichen.

Gibt es denn eine einfache Möglichkeit, die "Maße" einer Seite auszulesen, ohne den halben Quelltext
auseinanderzunehmen?

Eben nicht, wie ich oben schon erläutert habe.

lks
Bitte warten ..
Mitglied: Festus94
26.12.2013 um 15:40 Uhr
Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht mehr verändert.

Also unter'm Strich entweder grob oder gar nicht?


tbnwadm
Bitte warten ..
Mitglied: Lochkartenstanzer
LÖSUNG 26.12.2013, aktualisiert um 17:05 Uhr
Zitat von Festus94:

Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht
mehr verändert.

Dann kann ich dir eine bauen, die egal wie große Du das Fenster horizontal oder vertikal machst, dieses immer voll uund ganz mit Text ausgefüllt wird.

Klar spätestens dann, wenn der ganze Content in "eine Zeile" paßt, wird da nichts mehr kommen. Das Probem ist aber, daß Du nie weißt, welche Größen der "Webseitenbauer" vorgesehen hat.

Im Endeffekt läuft es darauf hinaus, daß Du der rendering-engine sagen mußt, für welche Auflösung sie rendern soll und dementsprechend sieht es mal gut und mal nicht so gut aus.

Ich persönlich benutze einfach die Druckvorschau von Firefox mit manuell angepaßter Skalierung, wobei 60% bei A4-hoch und 80% bei A4-quer meistens gut passen.

lks
Bitte warten ..
Mitglied: Festus94
26.12.2013 um 17:04 Uhr
Zitat von Lochkartenstanzer:

> Zitat von Festus94:
>
> Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung
nicht
> mehr verändert.

Dann kann ich dir eine bauen, die egal wie große Du das Fenster horizontal oder vertikal machst, dieses immer voll uund ganz
mit Text ausgefüllt wird.

Klar, das kann ich auch...

Zitat von Lochkartenstanzer:

Klar spätestens dann, wenn der ganze Content in "eine Zeile" paßt, wird da nichts mehr kommen. Das Probem ist
aber, daß Du nie weißt, welche Größen der "Webseitenbauer" vorgesehen hat.

Im Endeffekt läuft es darauf hinaus, daß Du der rendering-engine sagen mußt, für welche Auflösung sie
rendern soll und dementsprechend sieht es mal gut und mal nicht so gut aus.

Ich persönlich benutze einfach die Druckvorschau von Firefox mit manuell angepaßter Skalierung, wobei 60% bei A4-hoch
und 80% bei A4-quer meistens gut passen.

Alles klar, dann werde ich es mal auf die Art versuchen. Danke für Deine Hilfe!

Noch einen schönen letzten Weihnachtsabend!

Grüße
tbnwadm
Bitte warten ..
Mitglied: hackbrett2014
23.10.2014 um 10:05 Uhr
Ihr Lieben!
Ich will die Diskussion nochmal befeueren. Nicht um IE oder FF, sondern um das Thema „Website zu pdf“: Screenshots, also das Sichern von Bildschirminhalten in Pixelgrafiken kommt für meinen Anwendungsbedarf nicht in Frage, da die finalen PDFs durchsuchbar sein sollen, der Text markiert und kopiert werden können soll.

Das von Jürgen vorgeschlagene „Print pages to pdf“ erstellt m.E. niemals das, was auch ich suche. Bei den englischsprachigen Online-Dienstleistern wird es als „one long page“ bezeichnet. Bei den „Print pages to pdf“-Einstellungen wird nicht nur die Breite des Ausgabeformates, sondern immer auch die Länge angegeben ):

Bei pdfmyurl.com und crowdpdf und vielen anderen Online-Dienstleistern sieht das mittlerweile anders aus. Sie bieten in der Bezahlvariante die Option „one long page“ an, also im Prinzip: nicht umsonst (finde ich unproblematisch) und super. Aber: Ich habe 400 Seiten in einer Exceltabelle, die ich gerne als batch von einem Programm oder einem Onlinedienst distillt hätte. Ob man bei Lletzteren eine Liste URLs einspeisen kann, versuche ich gerade herauszufinden. Aber an und für sich kann ich es immernoch nicht glauben, dass das ein derartiger Krampf ist.

Hat inzwischen jmd. eine bessere Lösung ?

PS: Auch eine fast gute Lösung: mit der congenialen Erweiterung "Grab them all" und per txt.-Import hunderte von Websites in jpg oder png ichern lassen (jawoll, mit Sroll und in one long page) und diese dann im Acrobat durch den OCR jagen und als "durchsuchbares Bild (exakt)" abspeichern. Geschätzte 87% der Buchstaben werden richtig erkannt, wegen der restlichen 13% kommt die Methode nicht in Frage, obwohl alle Prozesse als batch ratz-fatz gehen. Cooles Teil: http://rafal.zelazko.info/2008/06/23/easy-screenshot-of-many-sites/
Bitte warten ..
Neuester Wissensbeitrag
CPU, RAM, Mainboards

Angetestet: PC Engines APU 3a2 im Rack-Gehäuse

(1)

Erfahrungsbericht von ashnod zum Thema CPU, RAM, Mainboards ...

Ähnliche Inhalte
Heiß diskutierte Inhalte
Grafikkarten & Monitore
Win 10 Grafikkarte Crash von Software? (13)

Frage von Marabunta zum Thema Grafikkarten & Monitore ...

DSL, VDSL
DSL-Signal bewerten (13)

Frage von SarekHL zum Thema DSL, VDSL ...

Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (9)

Frage von JayyyH zum Thema Switche und Hubs ...

Windows Server
Mailserver auf Windows Server 2012 (9)

Frage von StefanT81 zum Thema Windows Server ...