Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Text zwischen zwei Zeichenketten ausgeben

Frage Entwicklung Batch & Shell

Mitglied: Zappdidappdi

Zappdidappdi (Level 1) - Jetzt verbinden

18.07.2012 um 22:25 Uhr, 3530 Aufrufe, 10 Kommentare

Hallo liebe Leute,

ich habe derzeitig mir zur Aufgabe gemacht aus einer HTML Seite, die ich per wget runterlade, einen bestimmten Bereich auszulesen.
Dieser Bereich wird durch zwei Wörter Abgegrenzt die sich nicht verändern, der Bereich dazwischen jedoch schon.

Beispiel:
<p><strong>Obst</strong></p>Apfel,Birne,Erdbeere<p><strong>Gemüse</strong></p>Apfel, Melone, Gurke, Salat

Ich möchte nun alles in eine neue txt Datei bekommen, was zwischen Obst und Gemüse liegt, wenn es ein paar Zeichen mehr oder weniger sind ist das nicht so schlimm, hauptsache "Apfel,Birne,Erdbeere" sind vollkommen erhalten.

Das ganze würde ich gerne mit einer Batch Datei verwirklichen. Natürlich habe ich schon vorher gesucht und geschaut ob ich es selber hinkriege und bin auf Teile wie "for /F" gekommen, habe aber nicht so wirklich begriffen, wie das verwendet wird.

Ich hoffe ihr könnt mir helfen

Mit freundlichen Grüßen

Zappdidappdi
Mitglied: TsukiSan
19.07.2012 um 07:00 Uhr
Hallo Zappdidappdi,

also in Batch kann ich dir keine Lösung bieten, aber in VBS mal was zum Ausprobieren.

01.
Dim SuchAnfang, SuchEnde 
02.
 
03.
URLPfad = "http://de.wetter.yahoo.com/" 
04.
 
05.
SuchAnfang = Chr(34) & "day-temp-current temp-c " & Chr(34) & ">" 
06.
SuchEnde = "&" 
07.
 
08.
Set Http=CreateObject("WinHttp.WinHttpRequest.5.1") 
09.
 
10.
Http.Open "GET",URLPfad,False 
11.
Http.Send 
12.
 
13.
temp = split(Http.ResponseText,SuchAnfang) 
14.
temp1 = split(temp(1),SuchEnde) 
15.
temp2 = temp1(0) & "°C" 
16.
 
17.
Wscript.Echo  temp2
Gruss
Tsuki
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 09:13 Uhr
Hallo Tsuki!

Bei Html-Text empfehle ich der Einfachheit halber RegExp zu verwenden.

Mit dem Obst/Gemüsebeispiel das Ganze dann in etwa so:
01.
Option Explicit 
02.
 
03.
Const sURL = "http://www.ObstUndGemuese.de" 
04.
Const sTxtFile = "C:\Test.txt" 
05.
 
06.
Dim oFso, oFile, oRE, oMatch, oSubMatch, sText 
07.
     
08.
On Error Resume Next 
09.
     
10.
With CreateObject("WinHttp.WinHttpRequest.5.1") 
11.
   .Open "get", sURL, False 
12.
   .send 
13.
   sText = .responseText 
14.
End With 
15.
        
16.
If Err Then 
17.
    WScript.Echo "Webseite nicht verfügbar!":  WScript.Quit 1 
18.
End If 
19.
     
20.
On Error GoTo 0 
21.
 
22.
Set oRE = New RegExp 
23.
Set oFso = CreateObject("Scripting.FileSystemObject") 
24.
 
25.
Set oFile = oFso.CreateTextFile(sTxtFile) 
26.
 
27.
With oRE 
28.
    .Global = True 
29.
    .IgnoreCase = True 
30.
    .Pattern = "obst.*p>(.*)<p" 
31.
End With 
32.
     
33.
For Each oMatch In oRE.Execute(sText) 
34.
    For Each oSubMatch In oMatch.SubMatches 
35.
        oFile.WriteLine oSubMatch 
36.
    Next 
37.
Next 
38.
 
39.
oFile.Close 
40.
 
Gruß Dieter
Bitte warten ..
Mitglied: TsukiSan
19.07.2012 um 09:15 Uhr
Hallo Dieter,

das ist natürlich schöneres Obst/Gemüse, als meines

Aber wir wissen ja noch nicht, ob der TO es mit VBS machen möchte.

Trotzdem Danke an dich!

Gruss
Tsuki
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 09:43 Uhr
Hallo Tsuki!

Naja, um's verschönern gings mir eigentlich weniger, aber wenn Du es sagst

Aber wir wissen ja noch nicht, ob der TO es mit VBS machen möchte.
Vielleicht liefert bastla auch noch eine Batchlösung, wobei ich denke, dass auch er bei Html-Text eine RegExp-Variante einer Batch-Variante vorziehen würde?

Gruß Dieter
Bitte warten ..
Mitglied: bastla
19.07.2012, aktualisiert um 12:29 Uhr
[OT]
@Dieter
dass auch er bei Html-Text eine RegExp-Variante einer Batch-Variante vorziehen würde
So isses ...

Grüße
bastla
[/OT]
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 12:37 Uhr
[OT]
Hallo bastla!

So isses ...
War mir nur zu 99,9% sicher

Gruß Dieter
[/OT]
Bitte warten ..
Mitglied: bastla
19.07.2012, aktualisiert um 12:29 Uhr
[OT]
Hallo Dieter!
nur zu 99,9%
Da bin ich ja beruhigt, dass ich nicht sooo berechenbar bin ...

Grüße
bastla
[/OT]
Bitte warten ..
Mitglied: Zappdidappdi
19.07.2012 um 12:44 Uhr
So,schon mal vielen vielen Dank für eure wunderbare Hilfe.
Ich habe jetzt das VBS Script übernommen und angeguckt. Wenn ich das richtig verstehe ist folgende Zeile dafür zuständig....

Zitat von 76109:
With oRE
.Global = True
.IgnoreCase = True
.Pattern = "obst.*p>(.*)<p"

... was aus unserer Internetseite ausgeschnitten wird.Leider ist das Beispiel, das ich gegeben habe, sehr vereinfacht, es komme noch mehrere <strong> und <p> drin vor bis ich zum ersehnten "Gemüse" komme.
Wäre es möglich das Gemüse als endpunkt zu nehmen?



Des weiteren hätte ich da noch eine weitere Frage (tut mir leid, dass ich euch so viel beschäftige )
Kann man auch als eingrenzung sagen, dass er nur in der Zeile in der "<strong>Obst" steht das ganze machen soll? Nur als Absicherung falls die Seite noch mehr Obst oder Gemüse auf der Seite stehen hat, dass ich nicht möchte...

Vielen Dank für eure Hilfe
Bitte warten ..
Mitglied: 76109
19.07.2012, aktualisiert um 13:23 Uhr
Hallo Zappdidappdi!

Könnte so gehen:
.Pattern = "\n.*obst.*gemüse.*p>(.*)<.*\r"

Gruß Dieter
Bitte warten ..
Mitglied: Zappdidappdi
19.07.2012 um 14:03 Uhr
Zitat von 76109:
Hallo Zappdidappdi!

Könnte so gehen:
.Pattern = "\n.*obst.*gemüse.*p>(.*)<.*\r"

Gruß Dieter

Super, funktioniert einwandfrei!
Danke für eure Hilfe!

Bis zum nächsten Problem
Bitte warten ..
Neuester Wissensbeitrag
Microsoft

Lizenzwiederverkauf und seine Tücken

(5)

Erfahrungsbericht von DerWoWusste zum Thema Microsoft ...

Ähnliche Inhalte
Debian
gelöst Bash - String zwischen zwei Kommata ausgeben (3)

Frage von plutowitsch zum Thema Debian ...

VB for Applications
Dateien nach "Text" durchsuchen und Pfad ausgeben (32)

Frage von chgs2011 zum Thema VB for Applications ...

Humor (lol)
Der Unterschied zwischen USA und USB

Link von BirdyB zum Thema Humor (lol) ...

Windows Server
AD Replikation zwischen untergeordneten Domäne zwingend? (4)

Frage von Gien-app zum Thema Windows Server ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
FritzBox, zwei Server, verschiedene Netze (18)

Frage von DavidGl zum Thema LAN, WAN, Wireless ...

Windows Netzwerk
Windows 10 RDP geht nicht (16)

Frage von Fiasko zum Thema Windows Netzwerk ...

Windows Server
Outlook Verbindungsversuch mit Exchange (15)

Frage von xbast1x zum Thema Windows Server ...