Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Text zwischen zwei Zeichenketten ausgeben

Frage Entwicklung Batch & Shell

Mitglied: Zappdidappdi

Zappdidappdi (Level 1) - Jetzt verbinden

18.07.2012 um 22:25 Uhr, 3554 Aufrufe, 10 Kommentare

Hallo liebe Leute,

ich habe derzeitig mir zur Aufgabe gemacht aus einer HTML Seite, die ich per wget runterlade, einen bestimmten Bereich auszulesen.
Dieser Bereich wird durch zwei Wörter Abgegrenzt die sich nicht verändern, der Bereich dazwischen jedoch schon.

Beispiel:
<p><strong>Obst</strong></p>Apfel,Birne,Erdbeere<p><strong>Gemüse</strong></p>Apfel, Melone, Gurke, Salat

Ich möchte nun alles in eine neue txt Datei bekommen, was zwischen Obst und Gemüse liegt, wenn es ein paar Zeichen mehr oder weniger sind ist das nicht so schlimm, hauptsache "Apfel,Birne,Erdbeere" sind vollkommen erhalten.

Das ganze würde ich gerne mit einer Batch Datei verwirklichen. Natürlich habe ich schon vorher gesucht und geschaut ob ich es selber hinkriege und bin auf Teile wie "for /F" gekommen, habe aber nicht so wirklich begriffen, wie das verwendet wird.

Ich hoffe ihr könnt mir helfen

Mit freundlichen Grüßen

Zappdidappdi
Mitglied: TsukiSan
19.07.2012 um 07:00 Uhr
Hallo Zappdidappdi,

also in Batch kann ich dir keine Lösung bieten, aber in VBS mal was zum Ausprobieren.

01.
Dim SuchAnfang, SuchEnde 
02.
 
03.
URLPfad = "http://de.wetter.yahoo.com/" 
04.
 
05.
SuchAnfang = Chr(34) & "day-temp-current temp-c " & Chr(34) & ">" 
06.
SuchEnde = "&" 
07.
 
08.
Set Http=CreateObject("WinHttp.WinHttpRequest.5.1") 
09.
 
10.
Http.Open "GET",URLPfad,False 
11.
Http.Send 
12.
 
13.
temp = split(Http.ResponseText,SuchAnfang) 
14.
temp1 = split(temp(1),SuchEnde) 
15.
temp2 = temp1(0) & "°C" 
16.
 
17.
Wscript.Echo  temp2
Gruss
Tsuki
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 09:13 Uhr
Hallo Tsuki!

Bei Html-Text empfehle ich der Einfachheit halber RegExp zu verwenden.

Mit dem Obst/Gemüsebeispiel das Ganze dann in etwa so:
01.
Option Explicit 
02.
 
03.
Const sURL = "http://www.ObstUndGemuese.de" 
04.
Const sTxtFile = "C:\Test.txt" 
05.
 
06.
Dim oFso, oFile, oRE, oMatch, oSubMatch, sText 
07.
     
08.
On Error Resume Next 
09.
     
10.
With CreateObject("WinHttp.WinHttpRequest.5.1") 
11.
   .Open "get", sURL, False 
12.
   .send 
13.
   sText = .responseText 
14.
End With 
15.
        
16.
If Err Then 
17.
    WScript.Echo "Webseite nicht verfügbar!":  WScript.Quit 1 
18.
End If 
19.
     
20.
On Error GoTo 0 
21.
 
22.
Set oRE = New RegExp 
23.
Set oFso = CreateObject("Scripting.FileSystemObject") 
24.
 
25.
Set oFile = oFso.CreateTextFile(sTxtFile) 
26.
 
27.
With oRE 
28.
    .Global = True 
29.
    .IgnoreCase = True 
30.
    .Pattern = "obst.*p>(.*)<p" 
31.
End With 
32.
     
33.
For Each oMatch In oRE.Execute(sText) 
34.
    For Each oSubMatch In oMatch.SubMatches 
35.
        oFile.WriteLine oSubMatch 
36.
    Next 
37.
Next 
38.
 
39.
oFile.Close 
40.
 
Gruß Dieter
Bitte warten ..
Mitglied: TsukiSan
19.07.2012 um 09:15 Uhr
Hallo Dieter,

das ist natürlich schöneres Obst/Gemüse, als meines

Aber wir wissen ja noch nicht, ob der TO es mit VBS machen möchte.

Trotzdem Danke an dich!

Gruss
Tsuki
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 09:43 Uhr
Hallo Tsuki!

Naja, um's verschönern gings mir eigentlich weniger, aber wenn Du es sagst

Aber wir wissen ja noch nicht, ob der TO es mit VBS machen möchte.
Vielleicht liefert bastla auch noch eine Batchlösung, wobei ich denke, dass auch er bei Html-Text eine RegExp-Variante einer Batch-Variante vorziehen würde?

Gruß Dieter
Bitte warten ..
Mitglied: bastla
19.07.2012, aktualisiert um 12:29 Uhr
[OT]
@Dieter
dass auch er bei Html-Text eine RegExp-Variante einer Batch-Variante vorziehen würde
So isses ...

Grüße
bastla
[/OT]
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 12:37 Uhr
[OT]
Hallo bastla!

So isses ...
War mir nur zu 99,9% sicher

Gruß Dieter
[/OT]
Bitte warten ..
Mitglied: bastla
19.07.2012, aktualisiert um 12:29 Uhr
[OT]
Hallo Dieter!
nur zu 99,9%
Da bin ich ja beruhigt, dass ich nicht sooo berechenbar bin ...

Grüße
bastla
[/OT]
Bitte warten ..
Mitglied: Zappdidappdi
19.07.2012 um 12:44 Uhr
So,schon mal vielen vielen Dank für eure wunderbare Hilfe.
Ich habe jetzt das VBS Script übernommen und angeguckt. Wenn ich das richtig verstehe ist folgende Zeile dafür zuständig....

Zitat von 76109:
With oRE
.Global = True
.IgnoreCase = True
.Pattern = "obst.*p>(.*)<p"

... was aus unserer Internetseite ausgeschnitten wird.Leider ist das Beispiel, das ich gegeben habe, sehr vereinfacht, es komme noch mehrere <strong> und <p> drin vor bis ich zum ersehnten "Gemüse" komme.
Wäre es möglich das Gemüse als endpunkt zu nehmen?



Des weiteren hätte ich da noch eine weitere Frage (tut mir leid, dass ich euch so viel beschäftige )
Kann man auch als eingrenzung sagen, dass er nur in der Zeile in der "<strong>Obst" steht das ganze machen soll? Nur als Absicherung falls die Seite noch mehr Obst oder Gemüse auf der Seite stehen hat, dass ich nicht möchte...

Vielen Dank für eure Hilfe
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 13:23 Uhr
Hallo Zappdidappdi!

Könnte so gehen:
.Pattern = "\n.*obst.*gemüse.*p>(.*)<.*\r"

Gruß Dieter
Bitte warten ..
Mitglied: Zappdidappdi
19.07.2012 um 14:03 Uhr
Zitat von 76109:
Hallo Zappdidappdi!

Könnte so gehen:
.Pattern = "\n.*obst.*gemüse.*p>(.*)<.*\r"

Gruß Dieter

Super, funktioniert einwandfrei!
Danke für eure Hilfe!

Bis zum nächsten Problem
Bitte warten ..
Neuester Wissensbeitrag
Off Topic

"Ich habe nichts zu verbergen"

(1)

Erfahrungsbericht von FA-jka zum Thema Off Topic ...

Ähnliche Inhalte
Debian
gelöst Bash - String zwischen zwei Kommata ausgeben (3)

Frage von plutowitsch zum Thema Debian ...

Switche und Hubs
LAG zwischen SG300-Switches macht Probleme. Wer weiß Rat? (14)

Frage von White-Rabbit2 zum Thema Switche und Hubs ...

DSL, VDSL
gelöst LAN Kabel zwischen DSL-Anschluss und Modem (8)

Frage von MegaGiga zum Thema DSL, VDSL ...

Router & Routing
gelöst Routen zwischen den VLANs verhindern - ACL (11)

Frage von Maik82 zum Thema Router & Routing ...

Heiß diskutierte Inhalte
Hyper-V
gelöst Reiner Hyper- V Server oder lieber Rolle (28)

Frage von Winuser zum Thema Hyper-V ...

Exchange Server
gelöst Bestehende eMails autoamatisch weiterleiten (22)

Frage von metal-shot zum Thema Exchange Server ...

Apache Server
gelöst Lets Encrypt SSL mit Apache2 (20)

Frage von banane31 zum Thema Apache Server ...

SAN, NAS, DAS
gelöst Synology Version 6.1 Probleme (18)

Frage von Hendrik2586 zum Thema SAN, NAS, DAS ...