Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Verschachtelte Ausdrücke parsen

Frage Entwicklung PHP

Mitglied: Closed

Closed (Level 1) - Jetzt verbinden

12.01.2012 um 14:43 Uhr, 3362 Aufrufe, 5 Kommentare

Hi,

ich habe momentan ein Problem verschachtelte Ausdrücke zu parsen. Derzeit schlägt jeder meiner Ansätze fehl, weshalb ich nun auf Hinweise aus der Community hoffe.

Problem:
Ich habe einen String, als Beispiel: "a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m"

Der Strich ("-") stellt den nächsten Status auf dem dargestellten Pfad dard und die Pipe ("|") ein oder.
Ich habe im Endeffekt somit einen Pfad mit Verzweigungen.

Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Ich würde gerne etwas Code einfügen, der meine bisherigen Ansätze demonstriert, aber das bringt leider nicht viel. Die sind alle nicht annähernd praktikabel.

Bin um Hinweise dankbar...

Beste Grüße
Mitglied: nxclass
12.01.2012 um 15:38 Uhr
Wenn es sich um Zustände handelt, könnte man einfach so etwas machen:
01.
        $str = 'a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m'; 
02.
        $search = array( '-', '|' ); 
03.
        $replace = array( ' AND ', ' OR '); 
04.
        echo str_replace($search, $replace, $str);
Bitte warten ..
Mitglied: Closed
12.01.2012 um 15:45 Uhr
Ok, ich glaube, dass ich das PRoblem dann nicht deutlich beschrieben habe.

Ich müsse natürlich den Pfad nachbauen können. Sprich ich habe einen Oder-Operator und einen Next-Operator. Diese beiden Operatoren kommen der Reihe nach in ein Array. Es geht konkret eigentlich darum, wie ich die einzelnen Zustände den Objekten zuweisen kann und dabei die Klammerung nicht vernachlässige. Bei einem Oder muss ich somit genau wissen welches der linke Part ist und welches der Rechte etc.

Wenn die Oder-operatoren weg wären, dann wäre das parsen ja easy, aber mit den Oder-Operatoren ist es doch sehr knifflig.
Bitte warten ..
Mitglied: nxclass
12.01.2012 um 19:52 Uhr
mh ... evtl. als eine XML Sequenz ?
01.
<root> 
02.
    <position name="A"/> 
03.
    <position name="B" /> 
04.
    <branch> 
05.
        <left> 
06.
            <position name="C" /> 
07.
            <position name="D" /> 
08.
        </left> 
09.
        <right> 
10.
            <position name="E" /> 
11.
        </right> 
12.
    </branch> 
13.
    <branch> 
14.
        <left> 
15.
            <position name="F" /> 
16.
        </left> 
17.
        <right> 
18.
            <position name="G" /> 
19.
        </right> 
20.
    </branch> 
21.
    <branch> 
22.
        <left> 
23.
            <position name="H" /> 
24.
            <position name="I" /> 
25.
        </left> 
26.
        <right> 
27.
            <position name="J" /> 
28.
            <position name="K" /> 
29.
        </right> 
30.
    </branch> 
31.
    <position name="L" /> 
32.
    <position name="M" /> 
33.
</root>
Bitte warten ..
Mitglied: dog
13.01.2012 um 02:24 Uhr
Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Stichwort: Parser Generatoren.

Wenn du es selber machen willst braucht du wohl einen rekursiven zeichenbasierten Parser mit einem gemeinsamen Zeiger auf den String.

Ich hatte es grade beispielsweise mal fertig geschrieben, aber in dem Moment hat sich mein Editor verabschiedet.

Ein zusätzliches Problem ist, dass die Konstrukte
(f|g)
und
(f-e)
eine völlig andere Bedeutung haben, aber der Parser es erst nach dem 3. Zeichen erkennen kann - du würdest es dir leichter machen wenn du andere Klammern benutzt.

Als Denkanstoß mal die ungeprüfte BNF:
01.
<pfad> ::= <titel> <restpfad> 
02.
 
03.
<gruppe> ::= "(" <gruppentyp> ")" 
04.
<gruppentyp> ::= <pfad> | <oder> 
05.
<oder> ::= <odertyp> "|" <restoder> 
06.
<odertyp> ::= <titel> | <gruppe> 
07.
<restoder ::= <odertyp> | <oder> 
08.
<restpfad> ::= | "-" <pfadelement> 
09.
<pfadelement> ::= <pfad> | <gruppe> 
10.
<titel> ::= "a" | "b" | ... | z
Bitte warten ..
Mitglied: Closed
13.01.2012 um 17:37 Uhr
Vielen Dank für die Antworten.
Ich glaube, dass aktuell die XML-Lösung zu präferieren wäre. Die ist sicherlich am saubersten zu parsen.

Die andere Lösung gefällt definitiv, da weiß ich aber nicht wie viel Perfomanz verloren geht. Je nachdem wie verschachtelt die Ausdrücke sind, kann ich mir bei einem rekursiven Ansatz natürlich gut vorstellen, dass die Bearbeitung sehr lange dauert
Bitte warten ..
Neuester Wissensbeitrag
Internet

Unbemerkt - Telekom Netzumschaltung! - BNG - Broadband Network Gateway

(3)

Erfahrungsbericht von ashnod zum Thema Internet ...

Ähnliche Inhalte
Batch & Shell
Parsen mehrer Dateien und Ausgabe je einer Zeile (1)

Frage von grka zum Thema Batch & Shell ...

Windows Server
Wie SQL-Server Verzeichnis parsen lassen? (5)

Frage von YotYot zum Thema Windows Server ...

Heiß diskutierte Inhalte
Switche und Hubs
Trunk für 2xCisco Switch. Wo liegt der Fehler? (17)

Frage von JayyyH zum Thema Switche und Hubs ...

Windows Server
Outlook Verbindungsversuch mit Exchange (15)

Frage von xbast1x zum Thema Windows Server ...

DSL, VDSL
DSL-Signal bewerten (14)

Frage von SarekHL zum Thema DSL, VDSL ...