majcho
Goto Top

Wget mehrere gleichlautende index.html von mehreren Unterverzeichnissen lesen umbennen und offline speichern

Moin moin,

habe bei Strato einen Online-Speicher auch Hidrive genannt. Strato Hidrive speichert in jedem Verzeichniss eine index.html mit dem jeweiligen Inhalt des Verzeichnisses ab. Jetzt möchte ich gerne mit wget diese index.html lesen um meine Daten abzugleichen. Dafür vewende ich folgenden code:

wget --mirror --no-directories --accept=index.html "https://bn:pw@webdav.hidrive.strato.com/users/Sicherung/"

--mirror (oder -m) lade ich mir die gesamte Seite herunter beschränke das jedoch mit
--accept=index.html auf die Datei "index.html", mit dem Befehl
--no-directories (oder -nd) speicher ich diese index.html offline in ein einziges Verzeichniss ab ohne offline mehrere Verzeichnisse zu erstellen (davon habe ich hunderte).

Leider finde ich keine Lösung wie ich diese index.html bei jedem Ladevorgang entweder umbenenne oder verbinde. Denn die index.html wird für jedes Unterverzeichni neu geschrieben und die alte überschrieben.
Kommentar vom Moderator Biber am Jun 28, 2011 um 17:56:10 Uhr
Wget mehrere gleichlautende index.html von mehreren Unterverzeichnissen lesen umbennen und offline speichern
Set /a rgc+=1
#766

Content-Key: 168729

Url: https://administrator.de/contentid/168729

Printed on: April 23, 2024 at 18:04 o'clock

Member: Lochkartenstanzer
Lochkartenstanzer Jun 28, 2011 at 11:37:46 (UTC)
Goto Top
Mit -O kann man die Ausgabedatei angeben, nur wird Dir das so nichts nutzen, eil Du --mirror verwendest und nicht jedes index.html mit einem eigenen eigenen wget holst. Wenn Dir eine einzige Datei langt, in der alle index.html zusammengefaßt sind, sollte es also -O tun. ansonsten mußt Du Dir ein script schreiben, daß dir Verzeichnishierarchie nach index.htmls durchsucht und dann jedes einzeln holt und unter einen eigenen Namen ablegt.
Member: majcho
majcho Jun 28, 2011 at 12:13:03 (UTC)
Goto Top
Die Option -o überschreibt die index.html immer wieder von neuem. Geht es denn auch wenn das ganze wie im DOS mit >> oder in dem der Inhalt gesammelt und anschließend in eine .log Datei ausgegeben?
Member: Lochkartenstanzer
Lochkartenstanzer Jun 28, 2011 at 12:34:54 (UTC)
Goto Top
nicht
 -o 
sondern
 -O 


Du kannst natürlich mit
 wget -O zieldatei.txt  (weitere Optionen) xyz.z/index.html 
oder
 wget -O - (weitere Optionen) xyz.z/index.html | tee -a zieldatei.txt 
alles in eine Datei reinkippen.
Member: majcho
majcho Jun 28, 2011 at 13:14:49 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:
nicht
 -o 
sondern
 -O 


Genau das was ich braucht!!!

 -O 

Danke auch für den Tipp mit
 tee -a zieldatei.txt  
Member: Lochkartenstanzer
Lochkartenstanzer Jun 28, 2011 at 14:28:49 (UTC)
Goto Top
Kommentar ignorieren. War falsches Fenster.
Member: Lochkartenstanzer
Lochkartenstanzer Jun 28, 2011 at 18:47:51 (UTC)
Goto Top
 
--no-clobber

wäre noch eine Option, falls Du nicht eine Datei, sondern viele einzelne Dateien haben willst. Diese werden dann durchnummeriert.
Member: majcho
majcho Jun 28, 2011 at 19:26:25 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:
 
> --no-clobber
> 

wäre noch eine Option, falls Du nicht eine Datei, sondern viele einzelne Dateien haben willst. Diese werden dann
durchnummeriert.

Damit habe ich es auch schon probiert, die Kombination -m, -nd und -nc funktioniert nicht. Mit diesem Tee unter DOS (http://users.csc.calpoly.edu/~bfriesen/software/console.shtml) habe ich auch kein brauchbares Ergebnis erzielt. Somit blieb nur diese Variante:
 wget --no-check-certificate -O index.html -nd --mirror --accept=index.html 
Member: Lochkartenstanzer
Lochkartenstanzer Jun 28, 2011 at 20:24:51 (UTC)
Goto Top
Nimm cygwin von http://cygwin.com

Damit hast Du Deine gewohnte Unix/Linux/BSD-Umgebung.