Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Auslesen von HTML Dateien aus einem Verzeichnis und Speichern als CSV Datei

Frage Entwicklung Batch & Shell

Mitglied: svenac2010

svenac2010 (Level 1) - Jetzt verbinden

15.05.2013, aktualisiert 14:39 Uhr, 1475 Aufrufe, 3 Kommentare

Hallo,
ich habe einen Ordner mit HTML Dateien, welche per WGET abgerufen werden.
Die Dateien haben alle den selber inhaltichen Aufbau.

01.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 
02.
<HTML> 
03.
<HEAD> 
04.
	<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8"> 
05.
	<TITLE>Printers - CUPS 1.5.4</TITLE> 
06.
	<LINK REL="STYLESHEET" TYPE="text/css" HREF="/cups.css"> 
07.
	<LINK REL="SHORTCUT ICON" HREF="/images/cups-icon.png" TYPE="image/png"> 
08.
	 
09.
</HEAD> 
10.
<BODY> 
11.
<TABLE CLASS="page" SUMMARY="Printers"> 
12.
<TR><TD CLASS="body"> 
13.
<TABLE BORDER="0" CELLPADDING="0" CELLSPACING="0" SUMMARY=""> 
14.
<TR HEIGHT="36"> 
15.
<TD><A HREF="http://www.cups.org/" TARGET="_blank"><IMG 
16.
SRC="/images/left.gif" WIDTH="64" HEIGHT="36" BORDER="0" ALT=""></A></TD> 
17.
<TD CLASS="unsel"><A HREF="/">&nbsp;&nbsp;Home&nbsp;&nbsp;</A></TD> 
18.
<TD CLASS="unsel"><A HREF="/admin">&nbsp;&nbsp;Administration&nbsp;&nbsp;</A></TD> 
19.
<TD CLASS="unsel"><A HREF="/classes/">&nbsp;&nbsp;Classes&nbsp;&nbsp;</A></TD> 
20.
<TD CLASS="unsel"><A HREF="/help/">&nbsp;&nbsp;Online&nbsp;Help&nbsp;&nbsp;</A></TD> 
21.
<TD CLASS="unsel"><A HREF="/jobs/">&nbsp;&nbsp;Jobs&nbsp;&nbsp;</A></TD> 
22.
<TD CLASS="sel"><A HREF="/printers/">&nbsp;&nbsp;Printers&nbsp;&nbsp;</A></TD> 
23.
<TD CLASS="unsel" WIDTH="100%"><FORM ACTION="/help/" METHOD="GET"><INPUT 
24.
TYPE="SEARCH" NAME="QUERY" SIZE="20" PLACEHOLDER="Search Help" 
25.
VALUE="" AUTOSAVE="org.cups.help" RESULTS="20"></FORM></TD> 
26.
<TD><IMG SRC="/images/right.gif" WIDTH="4" HEIGHT="36" ALT=""></TD> 
27.
</TR> 
28.
<TR><TD COLSPAN="9">&nbsp;</TD></TR> 
29.
</TABLE> 
30.
<FORM ACTION="/printers/" METHOD="GET"> 
31.
 
32.
 
33.
 
34.
<P ALIGN="CENTER"><B>Search in 
35.
Printers:</B> 
36.
<INPUT TYPE="SEARCH" NAME="QUERY" VALUE="" SIZE="40"  PLACEHOLDER="" AUTOSAVE="org.cups.printers" RESULTS="20"> <INPUT 
37.
TYPE="SUBMIT" VALUE="Search"> <INPUT TYPE="SUBMIT" NAME="CLEAR" VALUE="Clear"></P> 
38.
 
39.
</FORM> 
40.
<P ALIGN="CENTER">Showing 1-13 of 13 printers.</P> 
41.
 
42.
<TABLE CLASS="list" SUMMARY="Printer List"> 
43.
<THEAD> 
44.
<TR><TH><A HREF="/printers/?QUERY=&amp;WHICH_JOBS=&amp;FIRST={FIRST}&amp;ORDER=dec"><SMALL>&#x25bc;</SMALL> Queue Name <SMALL>&#x25bc;</SMALL></A></TH><TH>Description</TH><TH>Location</TH><TH>Make and Model</TH><TH>URI</TH><TH>Status</TH></TR> 
45.
</THEAD> 
46.
<TBODY> 
47.
 
48.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD></TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.99.999:9100</TD><TD>Idle - "Invalid printer command &quot;Clean&quot;."</TD></TR> 
49.
 
50.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
51.
... 
52.
... 
53.
 
54.
</TBODY> 
55.
</TABLE></DIV> 
56.
</TD></TR> 
57.
<TR><TD>&nbsp;</TD></TR> 
58.
<TR><TD CLASS="trailer">CUPS and the CUPS logo are trademarks of 
59.
<A HREF="http://www.apple.com">Apple Inc.</A> CUPS is copyright 2007-2012 Apple 
60.
Inc. All rights reserved.</TD></TR> 
61.
</TABLE> 
62.
</BODY> 
63.
</HTML>
interessant sind die Zeilen
01.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>IDC Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
02.
 
03.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
04.
 
ich suche ich eine Möglichkeit aus diesen "Wust"
eine Neue Datei zu erhalten

URL;btnr;Standort;Printer;Model;Socket;Status
/printers/99999_I-Test_L1;99999;99999_I-Test_L1;IDC Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."
/printers/99999_I-Test_L1;99999_I-Test_L1;Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."

Habe versucht per HTMLasText eine Datei eine TXT zu erzeugen,
leider ist diese dann noch unübersichtlicher,
auch danach mit einem Script Daten suchen zu erstezen ist mir nicht möglich ein Ergebnis zu erzeugen ( Da zeichen Wie <" ect nicht als ersetzbares Zeichen erkannt werden.


Vielleicht ist hier jemand in der Lage aus einer HTML Datei Teile auszulesen und in eine neue Datei zu schreiben.
Mitglied: Endoro
15.05.2013 um 19:24 Uhr
Hallo svenac2010,
wenn du es nicht in VB machen möchtest, kann ich die grep, sed und awk empfehlen.

Gruss!
Bitte warten ..
Mitglied: Arano
15.05.2013 um 19:37 Uhr
Hallo Sven

  1. Batch oder Shell ?
  2. Die Beispieldaten deiner neuen Datei sind Müll ! Die Daten des ersten Datensatzes passen nicht mit der Kopfzeile überein und der zweite Datensatz enthält nur 6 Werte für die 7 Spalten !?
  3. Was ist denn DEIN ANSATZ bei dem wir HELFEN sollen !?


~Arano
Bitte warten ..
Mitglied: Endoro
15.05.2013 um 20:11 Uhr
Und mich würde noch interessieren, welches Tool nicht mit diesen Piecksern <> etc. umgehen kann? Und natürlich auch, warum du uns kein klitzekleines Fitzelchen Code zeigst

Liebe Grüsse.
Bitte warten ..
Ähnliche Inhalte
VB for Applications
gelöst Bestimmte Spalten aus CSV-Datei auslesen (VBS) (9)

Frage von Gurkenhobel zum Thema VB for Applications ...

Batch & Shell
Mehrere.csv Dateien zusammenfügen zu einer Datei mit bat (4)

Frage von Piotrney zum Thema Batch & Shell ...

Datenbanken
Access 2016 vertauscht Monat und Tag in meiner CSV Datei (1)

Frage von iGordon zum Thema Datenbanken ...

Neue Wissensbeiträge
Batch & Shell

Batch - ein paar Basics die man kennen sollte

Tipp von Pedant zum Thema Batch & Shell ...

Microsoft

Restrictor: Profi-Schutz für jedes Window

(6)

Tipp von AlFalcone zum Thema Microsoft ...

Batch & Shell

Batch zum Zurücksetzen eines lokalen Profils

Tipp von Mr.Error zum Thema Batch & Shell ...

Heiß diskutierte Inhalte
Microsoft Office
Saubere HTML aus Word-Dokument (16)

Frage von peterpa zum Thema Microsoft Office ...

Router & Routing
ASUS RT-N18U mit VPN Client hinter Fritzbox - Portforwarding (15)

Frage von marshall75000 zum Thema Router & Routing ...

Hosting & Housing
gelöst Webserver bei WIX, aber DNS Server wo anders (9)

Frage von laster zum Thema Hosting & Housing ...