Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Auslesen von HTML Dateien aus einem Verzeichnis und Speichern als CSV Datei

Frage Entwicklung Batch & Shell

Mitglied: svenac2010

svenac2010 (Level 1) - Jetzt verbinden

15.05.2013, aktualisiert 14:39 Uhr, 1483 Aufrufe, 3 Kommentare

Hallo,
ich habe einen Ordner mit HTML Dateien, welche per WGET abgerufen werden.
Die Dateien haben alle den selber inhaltichen Aufbau.

01.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 
02.
<HTML> 
03.
<HEAD> 
04.
	<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8"> 
05.
	<TITLE>Printers - CUPS 1.5.4</TITLE> 
06.
	<LINK REL="STYLESHEET" TYPE="text/css" HREF="/cups.css"> 
07.
	<LINK REL="SHORTCUT ICON" HREF="/images/cups-icon.png" TYPE="image/png"> 
08.
	 
09.
</HEAD> 
10.
<BODY> 
11.
<TABLE CLASS="page" SUMMARY="Printers"> 
12.
<TR><TD CLASS="body"> 
13.
<TABLE BORDER="0" CELLPADDING="0" CELLSPACING="0" SUMMARY=""> 
14.
<TR HEIGHT="36"> 
15.
<TD><A HREF="http://www.cups.org/" TARGET="_blank"><IMG 
16.
SRC="/images/left.gif" WIDTH="64" HEIGHT="36" BORDER="0" ALT=""></A></TD> 
17.
<TD CLASS="unsel"><A HREF="/">&nbsp;&nbsp;Home&nbsp;&nbsp;</A></TD> 
18.
<TD CLASS="unsel"><A HREF="/admin">&nbsp;&nbsp;Administration&nbsp;&nbsp;</A></TD> 
19.
<TD CLASS="unsel"><A HREF="/classes/">&nbsp;&nbsp;Classes&nbsp;&nbsp;</A></TD> 
20.
<TD CLASS="unsel"><A HREF="/help/">&nbsp;&nbsp;Online&nbsp;Help&nbsp;&nbsp;</A></TD> 
21.
<TD CLASS="unsel"><A HREF="/jobs/">&nbsp;&nbsp;Jobs&nbsp;&nbsp;</A></TD> 
22.
<TD CLASS="sel"><A HREF="/printers/">&nbsp;&nbsp;Printers&nbsp;&nbsp;</A></TD> 
23.
<TD CLASS="unsel" WIDTH="100%"><FORM ACTION="/help/" METHOD="GET"><INPUT 
24.
TYPE="SEARCH" NAME="QUERY" SIZE="20" PLACEHOLDER="Search Help" 
25.
VALUE="" AUTOSAVE="org.cups.help" RESULTS="20"></FORM></TD> 
26.
<TD><IMG SRC="/images/right.gif" WIDTH="4" HEIGHT="36" ALT=""></TD> 
27.
</TR> 
28.
<TR><TD COLSPAN="9">&nbsp;</TD></TR> 
29.
</TABLE> 
30.
<FORM ACTION="/printers/" METHOD="GET"> 
31.
 
32.
 
33.
 
34.
<P ALIGN="CENTER"><B>Search in 
35.
Printers:</B> 
36.
<INPUT TYPE="SEARCH" NAME="QUERY" VALUE="" SIZE="40"  PLACEHOLDER="" AUTOSAVE="org.cups.printers" RESULTS="20"> <INPUT 
37.
TYPE="SUBMIT" VALUE="Search"> <INPUT TYPE="SUBMIT" NAME="CLEAR" VALUE="Clear"></P> 
38.
 
39.
</FORM> 
40.
<P ALIGN="CENTER">Showing 1-13 of 13 printers.</P> 
41.
 
42.
<TABLE CLASS="list" SUMMARY="Printer List"> 
43.
<THEAD> 
44.
<TR><TH><A HREF="/printers/?QUERY=&amp;WHICH_JOBS=&amp;FIRST={FIRST}&amp;ORDER=dec"><SMALL>&#x25bc;</SMALL> Queue Name <SMALL>&#x25bc;</SMALL></A></TH><TH>Description</TH><TH>Location</TH><TH>Make and Model</TH><TH>URI</TH><TH>Status</TH></TR> 
45.
</THEAD> 
46.
<TBODY> 
47.
 
48.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD></TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.99.999:9100</TD><TD>Idle - "Invalid printer command &quot;Clean&quot;."</TD></TR> 
49.
 
50.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
51.
... 
52.
... 
53.
 
54.
</TBODY> 
55.
</TABLE></DIV> 
56.
</TD></TR> 
57.
<TR><TD>&nbsp;</TD></TR> 
58.
<TR><TD CLASS="trailer">CUPS and the CUPS logo are trademarks of 
59.
<A HREF="http://www.apple.com">Apple Inc.</A> CUPS is copyright 2007-2012 Apple 
60.
Inc. All rights reserved.</TD></TR> 
61.
</TABLE> 
62.
</BODY> 
63.
</HTML>
interessant sind die Zeilen
01.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>IDC Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
02.
 
03.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
04.
 
ich suche ich eine Möglichkeit aus diesen "Wust"
eine Neue Datei zu erhalten

URL;btnr;Standort;Printer;Model;Socket;Status
/printers/99999_I-Test_L1;99999;99999_I-Test_L1;IDC Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."
/printers/99999_I-Test_L1;99999_I-Test_L1;Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."

Habe versucht per HTMLasText eine Datei eine TXT zu erzeugen,
leider ist diese dann noch unübersichtlicher,
auch danach mit einem Script Daten suchen zu erstezen ist mir nicht möglich ein Ergebnis zu erzeugen ( Da zeichen Wie <" ect nicht als ersetzbares Zeichen erkannt werden.


Vielleicht ist hier jemand in der Lage aus einer HTML Datei Teile auszulesen und in eine neue Datei zu schreiben.
Mitglied: Endoro
15.05.2013 um 19:24 Uhr
Hallo svenac2010,
wenn du es nicht in VB machen möchtest, kann ich die grep, sed und awk empfehlen.

Gruss!
Bitte warten ..
Mitglied: Arano
15.05.2013 um 19:37 Uhr
Hallo Sven

  1. Batch oder Shell ?
  2. Die Beispieldaten deiner neuen Datei sind Müll ! Die Daten des ersten Datensatzes passen nicht mit der Kopfzeile überein und der zweite Datensatz enthält nur 6 Werte für die 7 Spalten !?
  3. Was ist denn DEIN ANSATZ bei dem wir HELFEN sollen !?


~Arano
Bitte warten ..
Mitglied: Endoro
15.05.2013 um 20:11 Uhr
Und mich würde noch interessieren, welches Tool nicht mit diesen Piecksern <> etc. umgehen kann? Und natürlich auch, warum du uns kein klitzekleines Fitzelchen Code zeigst

Liebe Grüsse.
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
gelöst Auslesen und Vergleichen Zweiter CSV Dateien Powershell (7)

Frage von Hainoon zum Thema Batch & Shell ...

Batch & Shell
gelöst Dateien aus CSV mit Batch suchen (5)

Frage von joes1609 zum Thema Batch & Shell ...

Windows Userverwaltung
gelöst Ordnergruppenfreigaben in CSV oder HTML auslesen (3)

Frage von JafThomas zum Thema Windows Userverwaltung ...

Neue Wissensbeiträge
Linux Netzwerk

Ping und das einstellbare Bytepattern

(1)

Erfahrungsbericht von LordGurke zum Thema Linux Netzwerk ...

Windows Update

Microsoft Update KB4034664 verursacht Probleme mit Multimonitor-Systemen

(3)

Tipp von beidermachtvongreyscull zum Thema Windows Update ...

Viren und Trojaner

CNC-Fräsen von MECANUMERIC werden (ggf.) mit Viren, Trojanern, Würmern ausgeliefert

(4)

Erfahrungsbericht von anteNope zum Thema Viren und Trojaner ...

Heiß diskutierte Inhalte
Microsoft Office
Office Druck fehler (18)

Frage von DaistwasimBusch zum Thema Microsoft Office ...

Windows Server
Zertifikat am DC erneuern funktioniert nicht (13)

Frage von takvorian zum Thema Windows Server ...