Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Auslesen von HTML Dateien aus einem Verzeichnis und Speichern als CSV Datei

Frage Entwicklung Batch & Shell

Mitglied: svenac2010

svenac2010 (Level 1) - Jetzt verbinden

15.05.2013, aktualisiert 14:39 Uhr, 1468 Aufrufe, 3 Kommentare

Hallo,
ich habe einen Ordner mit HTML Dateien, welche per WGET abgerufen werden.
Die Dateien haben alle den selber inhaltichen Aufbau.

01.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 
02.
<HTML> 
03.
<HEAD> 
04.
	<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8"> 
05.
	<TITLE>Printers - CUPS 1.5.4</TITLE> 
06.
	<LINK REL="STYLESHEET" TYPE="text/css" HREF="/cups.css"> 
07.
	<LINK REL="SHORTCUT ICON" HREF="/images/cups-icon.png" TYPE="image/png"> 
08.
	 
09.
</HEAD> 
10.
<BODY> 
11.
<TABLE CLASS="page" SUMMARY="Printers"> 
12.
<TR><TD CLASS="body"> 
13.
<TABLE BORDER="0" CELLPADDING="0" CELLSPACING="0" SUMMARY=""> 
14.
<TR HEIGHT="36"> 
15.
<TD><A HREF="http://www.cups.org/" TARGET="_blank"><IMG 
16.
SRC="/images/left.gif" WIDTH="64" HEIGHT="36" BORDER="0" ALT=""></A></TD> 
17.
<TD CLASS="unsel"><A HREF="/">&nbsp;&nbsp;Home&nbsp;&nbsp;</A></TD> 
18.
<TD CLASS="unsel"><A HREF="/admin">&nbsp;&nbsp;Administration&nbsp;&nbsp;</A></TD> 
19.
<TD CLASS="unsel"><A HREF="/classes/">&nbsp;&nbsp;Classes&nbsp;&nbsp;</A></TD> 
20.
<TD CLASS="unsel"><A HREF="/help/">&nbsp;&nbsp;Online&nbsp;Help&nbsp;&nbsp;</A></TD> 
21.
<TD CLASS="unsel"><A HREF="/jobs/">&nbsp;&nbsp;Jobs&nbsp;&nbsp;</A></TD> 
22.
<TD CLASS="sel"><A HREF="/printers/">&nbsp;&nbsp;Printers&nbsp;&nbsp;</A></TD> 
23.
<TD CLASS="unsel" WIDTH="100%"><FORM ACTION="/help/" METHOD="GET"><INPUT 
24.
TYPE="SEARCH" NAME="QUERY" SIZE="20" PLACEHOLDER="Search Help" 
25.
VALUE="" AUTOSAVE="org.cups.help" RESULTS="20"></FORM></TD> 
26.
<TD><IMG SRC="/images/right.gif" WIDTH="4" HEIGHT="36" ALT=""></TD> 
27.
</TR> 
28.
<TR><TD COLSPAN="9">&nbsp;</TD></TR> 
29.
</TABLE> 
30.
<FORM ACTION="/printers/" METHOD="GET"> 
31.
 
32.
 
33.
 
34.
<P ALIGN="CENTER"><B>Search in 
35.
Printers:</B> 
36.
<INPUT TYPE="SEARCH" NAME="QUERY" VALUE="" SIZE="40"  PLACEHOLDER="" AUTOSAVE="org.cups.printers" RESULTS="20"> <INPUT 
37.
TYPE="SUBMIT" VALUE="Search"> <INPUT TYPE="SUBMIT" NAME="CLEAR" VALUE="Clear"></P> 
38.
 
39.
</FORM> 
40.
<P ALIGN="CENTER">Showing 1-13 of 13 printers.</P> 
41.
 
42.
<TABLE CLASS="list" SUMMARY="Printer List"> 
43.
<THEAD> 
44.
<TR><TH><A HREF="/printers/?QUERY=&amp;WHICH_JOBS=&amp;FIRST={FIRST}&amp;ORDER=dec"><SMALL>&#x25bc;</SMALL> Queue Name <SMALL>&#x25bc;</SMALL></A></TH><TH>Description</TH><TH>Location</TH><TH>Make and Model</TH><TH>URI</TH><TH>Status</TH></TR> 
45.
</THEAD> 
46.
<TBODY> 
47.
 
48.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD></TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.99.999:9100</TD><TD>Idle - "Invalid printer command &quot;Clean&quot;."</TD></TR> 
49.
 
50.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
51.
... 
52.
... 
53.
 
54.
</TBODY> 
55.
</TABLE></DIV> 
56.
</TD></TR> 
57.
<TR><TD>&nbsp;</TD></TR> 
58.
<TR><TD CLASS="trailer">CUPS and the CUPS logo are trademarks of 
59.
<A HREF="http://www.apple.com">Apple Inc.</A> CUPS is copyright 2007-2012 Apple 
60.
Inc. All rights reserved.</TD></TR> 
61.
</TABLE> 
62.
</BODY> 
63.
</HTML>
interessant sind die Zeilen
01.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>IDC Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
02.
 
03.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
04.
 
ich suche ich eine Möglichkeit aus diesen "Wust"
eine Neue Datei zu erhalten

URL;btnr;Standort;Printer;Model;Socket;Status
/printers/99999_I-Test_L1;99999;99999_I-Test_L1;IDC Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."
/printers/99999_I-Test_L1;99999_I-Test_L1;Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."

Habe versucht per HTMLasText eine Datei eine TXT zu erzeugen,
leider ist diese dann noch unübersichtlicher,
auch danach mit einem Script Daten suchen zu erstezen ist mir nicht möglich ein Ergebnis zu erzeugen ( Da zeichen Wie <" ect nicht als ersetzbares Zeichen erkannt werden.


Vielleicht ist hier jemand in der Lage aus einer HTML Datei Teile auszulesen und in eine neue Datei zu schreiben.
Mitglied: Endoro
15.05.2013 um 19:24 Uhr
Hallo svenac2010,
wenn du es nicht in VB machen möchtest, kann ich die grep, sed und awk empfehlen.

Gruss!
Bitte warten ..
Mitglied: Arano
15.05.2013 um 19:37 Uhr
Hallo Sven

  1. Batch oder Shell ?
  2. Die Beispieldaten deiner neuen Datei sind Müll ! Die Daten des ersten Datensatzes passen nicht mit der Kopfzeile überein und der zweite Datensatz enthält nur 6 Werte für die 7 Spalten !?
  3. Was ist denn DEIN ANSATZ bei dem wir HELFEN sollen !?


~Arano
Bitte warten ..
Mitglied: Endoro
15.05.2013 um 20:11 Uhr
Und mich würde noch interessieren, welches Tool nicht mit diesen Piecksern <> etc. umgehen kann? Und natürlich auch, warum du uns kein klitzekleines Fitzelchen Code zeigst

Liebe Grüsse.
Bitte warten ..
Ähnliche Inhalte
VB for Applications
gelöst Bestimmte Spalten aus CSV-Datei auslesen (VBS) (9)

Frage von Gurkenhobel zum Thema VB for Applications ...

Batch & Shell
Mehrere.csv Dateien zusammenfügen zu einer Datei mit bat (4)

Frage von Piotrney zum Thema Batch & Shell ...

Webentwicklung
gelöst HTML Output in eine txt Datei mit VisualBasicScript (2)

Frage von coca22COCA zum Thema Webentwicklung ...

VB for Applications
Bestimmte Daten aus eine CSV-Datei in eine Excel-Tabelle importieren (2)

Frage von MariaElena zum Thema VB for Applications ...

Heiß diskutierte Inhalte
Windows 7
gelöst BOOTMGR is missing (auch nach bootrec -RebuildBcd) (20)

Frage von Mipronimo zum Thema Windows 7 ...

Router & Routing
Tipps für Router (ca. 100 clients, VPN) (19)

Frage von oel-auge zum Thema Router & Routing ...

Windows Userverwaltung
Windows Freigabe: Zugriff auf alle Ordner trotz Sicherheitseinstellungen (17)

Frage von Pandreas zum Thema Windows Userverwaltung ...

TK-Netze & Geräte
gelöst Convert von TAPI auf CAPI gesucht (13)

Frage von StefanKittel zum Thema TK-Netze & Geräte ...