Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Verschachtelte Ausdrücke parsen

Frage Entwicklung PHP

Mitglied: Closed

Closed (Level 1) - Jetzt verbinden

12.01.2012 um 14:43 Uhr, 3370 Aufrufe, 5 Kommentare

Hi,

ich habe momentan ein Problem verschachtelte Ausdrücke zu parsen. Derzeit schlägt jeder meiner Ansätze fehl, weshalb ich nun auf Hinweise aus der Community hoffe.

Problem:
Ich habe einen String, als Beispiel: "a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m"

Der Strich ("-") stellt den nächsten Status auf dem dargestellten Pfad dard und die Pipe ("|") ein oder.
Ich habe im Endeffekt somit einen Pfad mit Verzweigungen.

Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Ich würde gerne etwas Code einfügen, der meine bisherigen Ansätze demonstriert, aber das bringt leider nicht viel. Die sind alle nicht annähernd praktikabel.

Bin um Hinweise dankbar...

Beste Grüße
Mitglied: nxclass
12.01.2012 um 15:38 Uhr
Wenn es sich um Zustände handelt, könnte man einfach so etwas machen:
01.
        $str = 'a-b-(((c-d)|e)-(f|g))-((h-i)|(j-k))-l-m'; 
02.
        $search = array( '-', '|' ); 
03.
        $replace = array( ' AND ', ' OR '); 
04.
        echo str_replace($search, $replace, $str);
Bitte warten ..
Mitglied: Closed
12.01.2012 um 15:45 Uhr
Ok, ich glaube, dass ich das PRoblem dann nicht deutlich beschrieben habe.

Ich müsse natürlich den Pfad nachbauen können. Sprich ich habe einen Oder-Operator und einen Next-Operator. Diese beiden Operatoren kommen der Reihe nach in ein Array. Es geht konkret eigentlich darum, wie ich die einzelnen Zustände den Objekten zuweisen kann und dabei die Klammerung nicht vernachlässige. Bei einem Oder muss ich somit genau wissen welches der linke Part ist und welches der Rechte etc.

Wenn die Oder-operatoren weg wären, dann wäre das parsen ja easy, aber mit den Oder-Operatoren ist es doch sehr knifflig.
Bitte warten ..
Mitglied: nxclass
12.01.2012 um 19:52 Uhr
mh ... evtl. als eine XML Sequenz ?
01.
<root> 
02.
    <position name="A"/> 
03.
    <position name="B" /> 
04.
    <branch> 
05.
        <left> 
06.
            <position name="C" /> 
07.
            <position name="D" /> 
08.
        </left> 
09.
        <right> 
10.
            <position name="E" /> 
11.
        </right> 
12.
    </branch> 
13.
    <branch> 
14.
        <left> 
15.
            <position name="F" /> 
16.
        </left> 
17.
        <right> 
18.
            <position name="G" /> 
19.
        </right> 
20.
    </branch> 
21.
    <branch> 
22.
        <left> 
23.
            <position name="H" /> 
24.
            <position name="I" /> 
25.
        </left> 
26.
        <right> 
27.
            <position name="J" /> 
28.
            <position name="K" /> 
29.
        </right> 
30.
    </branch> 
31.
    <position name="L" /> 
32.
    <position name="M" /> 
33.
</root>
Bitte warten ..
Mitglied: dog
13.01.2012 um 02:24 Uhr
Gibt es irgendwelche Parser-Libraries, die einem solche Ausdrücke sinnvoll zurück geben?

Stichwort: Parser Generatoren.

Wenn du es selber machen willst braucht du wohl einen rekursiven zeichenbasierten Parser mit einem gemeinsamen Zeiger auf den String.

Ich hatte es grade beispielsweise mal fertig geschrieben, aber in dem Moment hat sich mein Editor verabschiedet.

Ein zusätzliches Problem ist, dass die Konstrukte
(f|g)
und
(f-e)
eine völlig andere Bedeutung haben, aber der Parser es erst nach dem 3. Zeichen erkennen kann - du würdest es dir leichter machen wenn du andere Klammern benutzt.

Als Denkanstoß mal die ungeprüfte BNF:
01.
<pfad> ::= <titel> <restpfad> 
02.
 
03.
<gruppe> ::= "(" <gruppentyp> ")" 
04.
<gruppentyp> ::= <pfad> | <oder> 
05.
<oder> ::= <odertyp> "|" <restoder> 
06.
<odertyp> ::= <titel> | <gruppe> 
07.
<restoder ::= <odertyp> | <oder> 
08.
<restpfad> ::= | "-" <pfadelement> 
09.
<pfadelement> ::= <pfad> | <gruppe> 
10.
<titel> ::= "a" | "b" | ... | z
Bitte warten ..
Mitglied: Closed
13.01.2012 um 17:37 Uhr
Vielen Dank für die Antworten.
Ich glaube, dass aktuell die XML-Lösung zu präferieren wäre. Die ist sicherlich am saubersten zu parsen.

Die andere Lösung gefällt definitiv, da weiß ich aber nicht wie viel Perfomanz verloren geht. Je nachdem wie verschachtelt die Ausdrücke sind, kann ich mir bei einem rekursiven Ansatz natürlich gut vorstellen, dass die Bearbeitung sehr lange dauert
Bitte warten ..
Neuester Wissensbeitrag
Ähnliche Inhalte
Batch & Shell
Verschachtelte For Schleife für Batch Neuling (3)

Frage von yperiu zum Thema Batch & Shell ...

Batch & Shell
gelöst Verschachtelte FOR-Schleife mit einem Argument (3)

Frage von mp-home zum Thema Batch & Shell ...

Sonstige Systeme
Software zum Parsen von Emails und PDFs (12)

Frage von Zero01 zum Thema Sonstige Systeme ...

Datenbanken
gelöst Verschachtelte SQL-Abfrage (4)

Frage von User1000 zum Thema Datenbanken ...

Heiß diskutierte Inhalte
Erkennung und -Abwehr
Virenschutz - Meinungen (26)

Frage von honeybee zum Thema Erkennung und -Abwehr ...

Netzwerke
Abisolierwerkzeug (18)

Frage von SarekHL zum Thema Netzwerke ...

Windows 10
Welches OS für Firmengeräte? (17)

Frage von MarkusVH zum Thema Windows 10 ...

Exchange Server
SBS2011: POP3-Connector 10 MB Grenze Email Benachrichtigung (17)

Frage von bogi1102 zum Thema Exchange Server ...