Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Verschachtelte Ausdrücke parsen

Frage Entwicklung PHP

Mitglied: Closed

Closed (Level 1) - Jetzt verbinden

12.01.2012 um 14:43 Uhr, 3383 Aufrufe, 5 Kommentare

Hi,

ich habe momentan ein Problem verschachtelte Ausdrücke zu parsen. Derzeit schlägt jeder meiner Ansätze fehl, weshalb ich nun auf Hinweise aus der Community hoffe.

Problem:
Ich habe einen String, als Beispiel: "a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m"

Der Strich ("-") stellt den nächsten Status auf dem dargestellten Pfad dard und die Pipe ("|") ein oder.
Ich habe im Endeffekt somit einen Pfad mit Verzweigungen.

Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Ich würde gerne etwas Code einfügen, der meine bisherigen Ansätze demonstriert, aber das bringt leider nicht viel. Die sind alle nicht annähernd praktikabel.

Bin um Hinweise dankbar...

Beste Grüße
Mitglied: nxclass
12.01.2012 um 15:38 Uhr
Wenn es sich um Zustände handelt, könnte man einfach so etwas machen:
01.
        $str = 'a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m'; 
02.
        $search = array( '-', '|' ); 
03.
        $replace = array( ' AND ', ' OR '); 
04.
        echo str_replace($search, $replace, $str);
Bitte warten ..
Mitglied: Closed
12.01.2012 um 15:45 Uhr
Ok, ich glaube, dass ich das PRoblem dann nicht deutlich beschrieben habe.

Ich müsse natürlich den Pfad nachbauen können. Sprich ich habe einen Oder-Operator und einen Next-Operator. Diese beiden Operatoren kommen der Reihe nach in ein Array. Es geht konkret eigentlich darum, wie ich die einzelnen Zustände den Objekten zuweisen kann und dabei die Klammerung nicht vernachlässige. Bei einem Oder muss ich somit genau wissen welches der linke Part ist und welches der Rechte etc.

Wenn die Oder-operatoren weg wären, dann wäre das parsen ja easy, aber mit den Oder-Operatoren ist es doch sehr knifflig.
Bitte warten ..
Mitglied: nxclass
12.01.2012 um 19:52 Uhr
mh ... evtl. als eine XML Sequenz ?
01.
<root> 
02.
    <position name="A"/> 
03.
    <position name="B" /> 
04.
    <branch> 
05.
        <left> 
06.
            <position name="C" /> 
07.
            <position name="D" /> 
08.
        </left> 
09.
        <right> 
10.
            <position name="E" /> 
11.
        </right> 
12.
    </branch> 
13.
    <branch> 
14.
        <left> 
15.
            <position name="F" /> 
16.
        </left> 
17.
        <right> 
18.
            <position name="G" /> 
19.
        </right> 
20.
    </branch> 
21.
    <branch> 
22.
        <left> 
23.
            <position name="H" /> 
24.
            <position name="I" /> 
25.
        </left> 
26.
        <right> 
27.
            <position name="J" /> 
28.
            <position name="K" /> 
29.
        </right> 
30.
    </branch> 
31.
    <position name="L" /> 
32.
    <position name="M" /> 
33.
</root>
Bitte warten ..
Mitglied: dog
13.01.2012 um 02:24 Uhr
Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Stichwort: Parser Generatoren.

Wenn du es selber machen willst braucht du wohl einen rekursiven zeichenbasierten Parser mit einem gemeinsamen Zeiger auf den String.

Ich hatte es grade beispielsweise mal fertig geschrieben, aber in dem Moment hat sich mein Editor verabschiedet.

Ein zusätzliches Problem ist, dass die Konstrukte
(f|g)
und
(f-e)
eine völlig andere Bedeutung haben, aber der Parser es erst nach dem 3. Zeichen erkennen kann - du würdest es dir leichter machen wenn du andere Klammern benutzt.

Als Denkanstoß mal die ungeprüfte BNF:
01.
<pfad> ::= <titel> <restpfad> 
02.
 
03.
<gruppe> ::= "(" <gruppentyp> ")" 
04.
<gruppentyp> ::= <pfad> | <oder> 
05.
<oder> ::= <odertyp> "|" <restoder> 
06.
<odertyp> ::= <titel> | <gruppe> 
07.
<restoder ::= <odertyp> | <oder> 
08.
<restpfad> ::= | "-" <pfadelement> 
09.
<pfadelement> ::= <pfad> | <gruppe> 
10.
<titel> ::= "a" | "b" | ... | z
Bitte warten ..
Mitglied: Closed
13.01.2012 um 17:37 Uhr
Vielen Dank für die Antworten.
Ich glaube, dass aktuell die XML-Lösung zu präferieren wäre. Die ist sicherlich am saubersten zu parsen.

Die andere Lösung gefällt definitiv, da weiß ich aber nicht wie viel Perfomanz verloren geht. Je nachdem wie verschachtelt die Ausdrücke sind, kann ich mir bei einem rekursiven Ansatz natürlich gut vorstellen, dass die Bearbeitung sehr lange dauert
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
gelöst Verschachtelte FOR-Schleife mit einem Argument (3)

Frage von mp-home zum Thema Batch & Shell ...

C und C++
Parsen eines Wertes zwischen zwei Tags (c++, xml) (1)

Frage von peterpa zum Thema C und C ...

Sonstige Systeme
Software zum Parsen von Emails und PDFs (12)

Frage von Zero01 zum Thema Sonstige Systeme ...

Batch & Shell
CMD cURL Access Token parsen (2)

Frage von maddig zum Thema Batch & Shell ...

Neue Wissensbeiträge
Windows Update

Microsoft Update KB4034664 verursacht Probleme mit Multimonitor-Systemen

(2)

Tipp von beidermachtvongreyscull zum Thema Windows Update ...

Viren und Trojaner

CNC-Fräsen von MECANUMERIC werden (ggf.) mit Viren, Trojanern, Würmern ausgeliefert

(4)

Erfahrungsbericht von anteNope zum Thema Viren und Trojaner ...

Windows 10

Windows 10: Erste Anmeldung Animation deaktivieren

(3)

Anleitung von alemanne21 zum Thema Windows 10 ...

Heiß diskutierte Inhalte
Netzwerkprotokolle
gelöst Leiten "dumme" Switches VLAN-Tags mit durch? (26)

Frage von coltseavers zum Thema Netzwerkprotokolle ...

Windows Server
gelöst Neues KB für W10 1607 und W2K16 wieder mal nicht im WSUS 3.0, hat das noch jemand? (16)

Frage von departure69 zum Thema Windows Server ...

Netzwerkgrundlagen
Kann auf Freigabe nicht Zugreifen (15)

Frage von leon123 zum Thema Netzwerkgrundlagen ...

Router & Routing
FTTH bzw FTTB Router (13)

Frage von ukulele-7 zum Thema Router & Routing ...