Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Verschachtelte Ausdrücke parsen

Frage Entwicklung PHP

Mitglied: Closed

Closed (Level 1) - Jetzt verbinden

12.01.2012 um 14:43 Uhr, 3366 Aufrufe, 5 Kommentare

Hi,

ich habe momentan ein Problem verschachtelte Ausdrücke zu parsen. Derzeit schlägt jeder meiner Ansätze fehl, weshalb ich nun auf Hinweise aus der Community hoffe.

Problem:
Ich habe einen String, als Beispiel: "a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m"

Der Strich ("-") stellt den nächsten Status auf dem dargestellten Pfad dard und die Pipe ("|") ein oder.
Ich habe im Endeffekt somit einen Pfad mit Verzweigungen.

Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Ich würde gerne etwas Code einfügen, der meine bisherigen Ansätze demonstriert, aber das bringt leider nicht viel. Die sind alle nicht annähernd praktikabel.

Bin um Hinweise dankbar...

Beste Grüße
Mitglied: nxclass
12.01.2012 um 15:38 Uhr
Wenn es sich um Zustände handelt, könnte man einfach so etwas machen:
01.
        $str = 'a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m'; 
02.
        $search = array( '-', '|' ); 
03.
        $replace = array( ' AND ', ' OR '); 
04.
        echo str_replace($search, $replace, $str);
Bitte warten ..
Mitglied: Closed
12.01.2012 um 15:45 Uhr
Ok, ich glaube, dass ich das PRoblem dann nicht deutlich beschrieben habe.

Ich müsse natürlich den Pfad nachbauen können. Sprich ich habe einen Oder-Operator und einen Next-Operator. Diese beiden Operatoren kommen der Reihe nach in ein Array. Es geht konkret eigentlich darum, wie ich die einzelnen Zustände den Objekten zuweisen kann und dabei die Klammerung nicht vernachlässige. Bei einem Oder muss ich somit genau wissen welches der linke Part ist und welches der Rechte etc.

Wenn die Oder-operatoren weg wären, dann wäre das parsen ja easy, aber mit den Oder-Operatoren ist es doch sehr knifflig.
Bitte warten ..
Mitglied: nxclass
12.01.2012 um 19:52 Uhr
mh ... evtl. als eine XML Sequenz ?
01.
<root> 
02.
    <position name="A"/> 
03.
    <position name="B" /> 
04.
    <branch> 
05.
        <left> 
06.
            <position name="C" /> 
07.
            <position name="D" /> 
08.
        </left> 
09.
        <right> 
10.
            <position name="E" /> 
11.
        </right> 
12.
    </branch> 
13.
    <branch> 
14.
        <left> 
15.
            <position name="F" /> 
16.
        </left> 
17.
        <right> 
18.
            <position name="G" /> 
19.
        </right> 
20.
    </branch> 
21.
    <branch> 
22.
        <left> 
23.
            <position name="H" /> 
24.
            <position name="I" /> 
25.
        </left> 
26.
        <right> 
27.
            <position name="J" /> 
28.
            <position name="K" /> 
29.
        </right> 
30.
    </branch> 
31.
    <position name="L" /> 
32.
    <position name="M" /> 
33.
</root>
Bitte warten ..
Mitglied: dog
13.01.2012 um 02:24 Uhr
Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Stichwort: Parser Generatoren.

Wenn du es selber machen willst braucht du wohl einen rekursiven zeichenbasierten Parser mit einem gemeinsamen Zeiger auf den String.

Ich hatte es grade beispielsweise mal fertig geschrieben, aber in dem Moment hat sich mein Editor verabschiedet.

Ein zusätzliches Problem ist, dass die Konstrukte
(f|g)
und
(f-e)
eine völlig andere Bedeutung haben, aber der Parser es erst nach dem 3. Zeichen erkennen kann - du würdest es dir leichter machen wenn du andere Klammern benutzt.

Als Denkanstoß mal die ungeprüfte BNF:
01.
<pfad> ::= <titel> <restpfad> 
02.
 
03.
<gruppe> ::= "(" <gruppentyp> ")" 
04.
<gruppentyp> ::= <pfad> | <oder> 
05.
<oder> ::= <odertyp> "|" <restoder> 
06.
<odertyp> ::= <titel> | <gruppe> 
07.
<restoder ::= <odertyp> | <oder> 
08.
<restpfad> ::= | "-" <pfadelement> 
09.
<pfadelement> ::= <pfad> | <gruppe> 
10.
<titel> ::= "a" | "b" | ... | z
Bitte warten ..
Mitglied: Closed
13.01.2012 um 17:37 Uhr
Vielen Dank für die Antworten.
Ich glaube, dass aktuell die XML-Lösung zu präferieren wäre. Die ist sicherlich am saubersten zu parsen.

Die andere Lösung gefällt definitiv, da weiß ich aber nicht wie viel Perfomanz verloren geht. Je nachdem wie verschachtelt die Ausdrücke sind, kann ich mir bei einem rekursiven Ansatz natürlich gut vorstellen, dass die Bearbeitung sehr lange dauert
Bitte warten ..
Neuester Wissensbeitrag
Router & Routing

192.168er Adresse im öffentlichen Netz

(1)

Erfahrungsbericht von visco-c zum Thema Router & Routing ...

Ähnliche Inhalte
Datenbanken
gelöst Verschachtelte SQL-Abfrage (4)

Frage von User1000 zum Thema Datenbanken ...

Batch & Shell
CMD cURL Access Token parsen (2)

Frage von maddig zum Thema Batch & Shell ...

Batch & Shell
Parsen mehrer Dateien und Ausgabe je einer Zeile (1)

Frage von grka zum Thema Batch & Shell ...

Heiß diskutierte Inhalte
Zusammenarbeit
Als Administrator im Großraumbüro (23)

Frage von Dopamin85 zum Thema Zusammenarbeit ...

Exchange Server
Test-ActiveSyncConnectivity Error nach neuem Zertifikat (19)

Frage von Driphex zum Thema Exchange Server ...

Hyper-V
HYPER V und USB (16)

Frage von Hendrik2586 zum Thema Hyper-V ...

Batch & Shell
gelöst Batch xls nach aktuellem Datum auslesen und email senden (14)

Frage von michi-ffm zum Thema Batch & Shell ...