vb-net
Goto Top

Mit wget eine Datei auslesen

Hallo Experten,

ich stehe vor einem Problem.

Eine CGI-Datei erzeugt in einem Webinterface eine Datei.

Nun wil ich diese Datei monatlich automatisch herunterladen über den cron.monthly.

Wenn ich nun mit wget den Link anspreche, dann erstellt er mir eine Datei, aber mit dem Quellcode.

Gibt es nun eine Möglichkeit nur den Text (der im Browser dargestellt wird) zu laden? (Ohne Quelltext)

Wäre nett wenn jemand einen Tipp geben könnte.

Gruß

VB-NET

Content-Key: 111242

Url: https://administrator.de/contentid/111242

Printed on: April 24, 2024 at 08:04 o'clock

Member: paulepank
paulepank Mar 12, 2009 at 13:45:03 (UTC)
Goto Top
Hallo VB-NET,

das Stichwort hierzu lautet : Textbasierter Browser.
Browserbeispiele hierzu Lynx und w3m.

mit w3m zb. so:
w3m -dump http://deine_Seite 

die Ausgabe kannst du in eine Datei leiten oder in einer Pipe weiterverarbeiten.

cu paulepank
Member: VB-NET
VB-NET Mar 18, 2009 at 09:09:47 (UTC)
Goto Top
Hi,

das hat ja schonmal gut funktioniert.

ich habe lynx genommen, da ich auch eine AUTH-Funktion haben muss.

Nun ist das problem, dass er mir Zeilenumbrüche in der Ausgabedatei macht.

Was soll ich nun tun?

Es sieht so aus, als wenn es eine "Zeilenlängenbegrenzung" gebe.

Im Browser (lynx) wirds richtig dargestellt, aber nicht in der Textdatei