mayho33
Goto Top

Powershell und REGEX

Hi @ All!

Und schon wieder hänge ich mal fest. Diesmal ist es eine Verständnisfrage mit REGEX wo ich nicht wirklich weiter komme:

Ich soll eine 4 Lichtjahre lange HTML (16 Mb groß!!!) nach einer variablen ID durchsuchen welche im HTML eine Überschrift repräsentiert. Alles was zwischen dieser und der Folgenden ID angegeben ist enthält Hostnames die sich auf diese ID beziehen. "Natürlich" gibt es keinen festen Bezug (Wenn ID dann Hostname, usw.) sondern es ist tatsächlich die Reihung das ausschlaggebende.

Dieses Problem ist bereits gelöst! Wo es wirklich hakt ist folgendes:

Ich matche auf die ID mit regex. Syntax:

Eine Zeile in der HTML wo REGEX matcht wäre: <h2 xmlns="" class="classsection4" id="idp68088064">73570 (1101) - Oracle Java SE Multiple Vulnerabilities (April 2014 CPU)</h2>

 
$test = Get-Content -Path "meine.html" -force  

foreach ($item in $test) {
    if ($item -match '(id[a-z]([0-9]{8,10}))') {  
        $item
    }
}

Nun will ich natürlich nicht die ganze Zeile, sondern nur das Matching ausgeben (in Folge in einer $Variable speichern und weiterverarbeiten) sprich: idp506922624. Irgendwie hakt's aber. Mein "HirnCompiler" schafft es nicht das Ergebnis umzudrehen, sprich: Speichere "nur" das Matching in der Variable

exemplarisch:

$test = Get-Content -Path "meine.html" -force  

foreach ($item in $test) {
    if ($item -match '(id[a-z]([0-9]{8,10}))') {  
        $result = (Nur das matching)
    }
}


Gibt es da eventuell eine einfache Möglichkeit z.B. das matching zu "negieren" oder muss ich nun tatsächlich mit der Kirche um's Dorf rennen. Zum Testen verwende ich http://www.regexr.com/

bin für jeden Ansatz dankbar.

Grüße

Mayho

Content-Key: 242365

Url: https://administrator.de/contentid/242365

Printed on: April 16, 2024 at 20:04 o'clock

Member: colinardo
Solution colinardo Jul 01, 2014 updated at 11:17:14 (UTC)
Goto Top
Moin,
no problem
$wert = [regex]::Match($test,'id="(id[a-z]\d{8,10})"').Groups[1].Value  
Täglich Brot face-smile

Grüße Uwe
Member: mayho33
mayho33 Jul 01, 2014 at 11:17:04 (UTC)
Goto Top
Sorry aber AHHHHHHHHRRRRRGHHHHHHHHHH!

Ich werd' wahnsinnig! Das flutscht wie ein geöltes Zäpfchen! Vielen, vielen Dank! Wieder mal!

lg

Mayho
Member: colinardo
colinardo Jul 01, 2014 updated at 11:20:29 (UTC)
Goto Top
als Alternative geht auch:
if ($item -match 'id="(id[a-z]\d{8,10})"') {  
        $result = $Matches[1]
}
mit der Globalen Variable $Matches die immer mit dem zuletzt ausgeführten Match gefüllt ist.

Grüße Uwe
Member: mayho33
mayho33 Jul 01, 2014 at 12:25:28 (UTC)
Goto Top
Das ist ja noch viel schöner, aber wo kommen die $matches[1] her??
Member: colinardo
colinardo Jul 01, 2014 updated at 12:51:36 (UTC)
Goto Top
Zitat von @mayho33:

Das ist ja noch viel schöner, aber wo kommen die $matches[1] her??

wie oben geschrieben wird die Variable automatisch von PS erstellt und gefüllt, wenn man einen Match-Vergleich durchgeführt hat.
Quasi magisch face-smile