Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Auslesen von HTML Dateien aus einem Verzeichnis und Speichern als CSV Datei

Frage Entwicklung Batch & Shell

Mitglied: svenac2010

svenac2010 (Level 1) - Jetzt verbinden

15.05.2013, aktualisiert 14:39 Uhr, 1485 Aufrufe, 3 Kommentare

Hallo,
ich habe einen Ordner mit HTML Dateien, welche per WGET abgerufen werden.
Die Dateien haben alle den selber inhaltichen Aufbau.

01.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 
02.
<HTML> 
03.
<HEAD> 
04.
	<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8"> 
05.
	<TITLE>Printers - CUPS 1.5.4</TITLE> 
06.
	<LINK REL="STYLESHEET" TYPE="text/css" HREF="/cups.css"> 
07.
	<LINK REL="SHORTCUT ICON" HREF="/images/cups-icon.png" TYPE="image/png"> 
08.
	 
09.
</HEAD> 
10.
<BODY> 
11.
<TABLE CLASS="page" SUMMARY="Printers"> 
12.
<TR><TD CLASS="body"> 
13.
<TABLE BORDER="0" CELLPADDING="0" CELLSPACING="0" SUMMARY=""> 
14.
<TR HEIGHT="36"> 
15.
<TD><A HREF="http://www.cups.org/" TARGET="_blank"><IMG 
16.
SRC="/images/left.gif" WIDTH="64" HEIGHT="36" BORDER="0" ALT=""></A></TD> 
17.
<TD CLASS="unsel"><A HREF="/">&nbsp;&nbsp;Home&nbsp;&nbsp;</A></TD> 
18.
<TD CLASS="unsel"><A HREF="/admin">&nbsp;&nbsp;Administration&nbsp;&nbsp;</A></TD> 
19.
<TD CLASS="unsel"><A HREF="/classes/">&nbsp;&nbsp;Classes&nbsp;&nbsp;</A></TD> 
20.
<TD CLASS="unsel"><A HREF="/help/">&nbsp;&nbsp;Online&nbsp;Help&nbsp;&nbsp;</A></TD> 
21.
<TD CLASS="unsel"><A HREF="/jobs/">&nbsp;&nbsp;Jobs&nbsp;&nbsp;</A></TD> 
22.
<TD CLASS="sel"><A HREF="/printers/">&nbsp;&nbsp;Printers&nbsp;&nbsp;</A></TD> 
23.
<TD CLASS="unsel" WIDTH="100%"><FORM ACTION="/help/" METHOD="GET"><INPUT 
24.
TYPE="SEARCH" NAME="QUERY" SIZE="20" PLACEHOLDER="Search Help" 
25.
VALUE="" AUTOSAVE="org.cups.help" RESULTS="20"></FORM></TD> 
26.
<TD><IMG SRC="/images/right.gif" WIDTH="4" HEIGHT="36" ALT=""></TD> 
27.
</TR> 
28.
<TR><TD COLSPAN="9">&nbsp;</TD></TR> 
29.
</TABLE> 
30.
<FORM ACTION="/printers/" METHOD="GET"> 
31.
 
32.
 
33.
 
34.
<P ALIGN="CENTER"><B>Search in 
35.
Printers:</B> 
36.
<INPUT TYPE="SEARCH" NAME="QUERY" VALUE="" SIZE="40"  PLACEHOLDER="" AUTOSAVE="org.cups.printers" RESULTS="20"> <INPUT 
37.
TYPE="SUBMIT" VALUE="Search"> <INPUT TYPE="SUBMIT" NAME="CLEAR" VALUE="Clear"></P> 
38.
 
39.
</FORM> 
40.
<P ALIGN="CENTER">Showing 1-13 of 13 printers.</P> 
41.
 
42.
<TABLE CLASS="list" SUMMARY="Printer List"> 
43.
<THEAD> 
44.
<TR><TH><A HREF="/printers/?QUERY=&amp;WHICH_JOBS=&amp;FIRST={FIRST}&amp;ORDER=dec"><SMALL>&#x25bc;</SMALL> Queue Name <SMALL>&#x25bc;</SMALL></A></TH><TH>Description</TH><TH>Location</TH><TH>Make and Model</TH><TH>URI</TH><TH>Status</TH></TR> 
45.
</THEAD> 
46.
<TBODY> 
47.
 
48.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD></TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.99.999:9100</TD><TD>Idle - "Invalid printer command &quot;Clean&quot;."</TD></TR> 
49.
 
50.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
51.
... 
52.
... 
53.
 
54.
</TBODY> 
55.
</TABLE></DIV> 
56.
</TD></TR> 
57.
<TR><TD>&nbsp;</TD></TR> 
58.
<TR><TD CLASS="trailer">CUPS and the CUPS logo are trademarks of 
59.
<A HREF="http://www.apple.com">Apple Inc.</A> CUPS is copyright 2007-2012 Apple 
60.
Inc. All rights reserved.</TD></TR> 
61.
</TABLE> 
62.
</BODY> 
63.
</HTML>
interessant sind die Zeilen
01.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>IDC Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
02.
 
03.
<TR><TD><A HREF="/printers/99999_I-Test_L1">99999_I-Test_L1</A></TD><TD>99999_I-Test_L1</TD><TD>Testraum 1</TD><TD>Kyocera Classic Universal (KPDL) (A4 models)</TD><TD>socket://99.99.999.999:9100</TD><TD>Idle - "Ready to print."</TD></TR> 
04.
 
ich suche ich eine Möglichkeit aus diesen "Wust"
eine Neue Datei zu erhalten

URL;btnr;Standort;Printer;Model;Socket;Status
/printers/99999_I-Test_L1;99999;99999_I-Test_L1;IDC Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."
/printers/99999_I-Test_L1;99999_I-Test_L1;Testraum 1;Kyocera Classic Universal (KPDL) (A4 models);socket://99.99.999.999:9100;Idle - "Ready to print."

Habe versucht per HTMLasText eine Datei eine TXT zu erzeugen,
leider ist diese dann noch unübersichtlicher,
auch danach mit einem Script Daten suchen zu erstezen ist mir nicht möglich ein Ergebnis zu erzeugen ( Da zeichen Wie <" ect nicht als ersetzbares Zeichen erkannt werden.


Vielleicht ist hier jemand in der Lage aus einer HTML Datei Teile auszulesen und in eine neue Datei zu schreiben.
Mitglied: Endoro
15.05.2013 um 19:24 Uhr
Hallo svenac2010,
wenn du es nicht in VB machen möchtest, kann ich die grep, sed und awk empfehlen.

Gruss!
Bitte warten ..
Mitglied: Arano
15.05.2013 um 19:37 Uhr
Hallo Sven

  1. Batch oder Shell ?
  2. Die Beispieldaten deiner neuen Datei sind Müll ! Die Daten des ersten Datensatzes passen nicht mit der Kopfzeile überein und der zweite Datensatz enthält nur 6 Werte für die 7 Spalten !?
  3. Was ist denn DEIN ANSATZ bei dem wir HELFEN sollen !?


~Arano
Bitte warten ..
Mitglied: Endoro
15.05.2013 um 20:11 Uhr
Und mich würde noch interessieren, welches Tool nicht mit diesen Piecksern <> etc. umgehen kann? Und natürlich auch, warum du uns kein klitzekleines Fitzelchen Code zeigst

Liebe Grüsse.
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
gelöst Auslesen und Vergleichen Zweiter CSV Dateien Powershell (7)

Frage von Hainoon zum Thema Batch & Shell ...

Batch & Shell
gelöst Dateien aus CSV mit Batch suchen (5)

Frage von joes1609 zum Thema Batch & Shell ...

Windows Userverwaltung
gelöst Ordnergruppenfreigaben in CSV oder HTML auslesen (3)

Frage von JafThomas zum Thema Windows Userverwaltung ...

Neue Wissensbeiträge
Humor (lol)

Wohnt jemand in Belgien und kann nicht mehr ruhig ausschlafen?

(3)

Information von LordGurke zum Thema Humor (lol) ...

Sicherheits-Tools

Trendmicro OSCE und das Fall Creators Update Win10 RS3

(3)

Information von Henere zum Thema Sicherheits-Tools ...

Microsoft Office

Text in Zahlen umwandeln

Tipp von logische zum Thema Microsoft Office ...

Erkennung und -Abwehr

Infineon TPMs unsicher! Bitlocker ggf. angreifbar

(4)

Information von Lochkartenstanzer zum Thema Erkennung und -Abwehr ...

Heiß diskutierte Inhalte
Microsoft Office
ICH BIN AM ENDE MEINES IT-WISSENS ANGELANGT!!!! (38)

Frage von 134537 zum Thema Microsoft Office ...

Windows Server
Gruppenrichtlinie greift nicht zu! (24)

Frage von Syosse zum Thema Windows Server ...

Hosting & Housing
Mailserver Software Empfehlungen (21)

Frage von sunics zum Thema Hosting & Housing ...