Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

BatchRex - Regular Expressions in Batch nutzen (oder: Wie extrahiert man bestimmten Text)

Anleitung Entwicklung Batch & Shell

Mitglied: colinardo

colinardo (Level 5) - Jetzt verbinden

21.07.2013, aktualisiert 25.04.2017, 9475 Aufrufe, 3 Danke

Da hier des öfteren Fragen in der Art "wie kann ich den String XY aus einem Text extrahieren" auftauchen, habe ich mich mal hingesetzt und ein Tool entwickelt das echte Regular Expressions in einer Batchdatei möglich macht. Ich nenne es mal passend : BatchRex.
Für all diejenigen die nur Batch nutzen (können/dürfen/sollen/wollen) soll das hier eine Erleichterung zum Extrahieren von speziellen Textfragmenten sein. Ich weiß es gibt da schon Tools wie "sed" - für manch einen Anfänger dürfte das jedoch Overkill sein.

Download

Das Tool kann hier kostenlos heruntergeladen werden
Aktuelle Version v0.8.0.50 vom 08.08.2013

Verwendung von BatchRex

BatchRex extrahiert Text anhand der Regular-Expression aus einem übergebenen String oder einer Textdatei und gibt die Treffer auf der Kommandozeile aus. Standardmäßig wird der erste Treffer in dem String ausgegeben. Sollen mehrere Vorkommen ausgegeben werden kann dies mit der Option /global erreicht werden.
Hinweise: Bei Verwendung der String-Option kann der Text nur aus einer Zeile bestehen und darf keine Zeilenumbrüche enthalten. Bitte beachtet auch die maximale Länge von 8.191 Zeichen die die Eingabeaufforderung akzeptiert. Sollen nur bestimmte Teile eines Patterns ausgegeben werden könnt Ihr das wie üblich mit Klammern () um den jeweiligen Part im Pattern machen. Außerdem kann mit dem Parameter /group:n die Gruppe ausgewählt werden welche ausgegeben werden soll.

BatchRex kennt folgende Kommandozeilen-Parameter:

Benötigte Parameter bei Übergabe eines Strings auf der Kommandozeile:
/string:"STRING DER DURCHSUCHT WERDEN SOLL" Text in dem gesucht werden soll
/pattern:"REGULAR EXPRESSION PATTERN" Regular Expression Pattern der den gesuchten Text extrahiert / Referenz der verfügbaren Regex-Optionen

Alternativ kann in einer Textdatei nach Text gesucht werden dann werden diese Parameter benötigt:
(Es kann nur eine der beiden Optionen genutzt werden: entweder /string oder /file)
Benötigte Parameter bei der Suche in einer Textdatei:
/file:"PFAD ZUR TEXTDATEI" Pfad zu einer Textdatei in der gesucht werden soll
/pattern:"REGULAR EXPRESSION PATTERN" Regular Expression Pattern der den gesuchten Text extrahiert / Referenz der verfügbaren Regex-Optionen

[Optionale Parameter]
/global Gibt alle Treffer des Pattern aus. Ohne diesen Parameter wird nur der erste Treffer des Pattern ausgegeben
/group:n Gibt die Gruppe mit der Nummer "n" innerhalb des Pattern an welche ausgegeben werden soll. Hierzu verwendet man Klammern im Pattern

Rückgabewerte
Zurückgegeben werden bei keinem Fehler die gefundenen Textstellen, ansonsten werden folgende Error-Codes zurückgegeben:

ERRORLEVEL Fehler
0 kein Fehler
1 Falsche Parameterverwendung
2 Keine passenden Fundstellen im Text
3 Syntaxfehler im Regular Expression Patttern
4 Datei existiert nicht
5 sonstiger Fehler

Beispiele

Beispiel 1: Die Verwendung in einer Batchdatei mit Übergabe eines Strings:

(Im Beispiel werden alle Telefonnummern extrahiert)
01.
@echo off 
02.
set "text=Dies ist der Text in dem gesucht wird Tel.: +49123456789 Tel.:+49987654321" 
03.
batchRex.exe /string:"%text%" /pattern:"Tel\.: ?(\+?\d*)" /global

Beispiel 2: Textdatei durchsuchen

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
batchRex.exe /file:"%datei%" /pattern:"Tel\.: ?(\+?\d*)" /global

Beispiel 3: Textdatei durchsuchen und nur ersten Treffer zurückgeben

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
batchRex.exe /file:"%datei%" /pattern:"Tel\.: ?(\+?\d*)"

Beispiel 4: Datei manuell Zeile für Zeile durchsuchen

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
for /f "usebackq tokens=* delims=" %%f IN ("%datei%") DO ( 
04.
    batchRex.exe /string:"%%f" /pattern:"Tel\.: ?(\+?\d*)" 
05.
)
Achtung Sonderzeichen
Zu beachten sind die Batch-Sonderzeichen im Zusammenhang mit dem Pattern. Sollen diese z.B. in dem Pattern verwendet werden müssen diese "Escaped" werden. Das Escapen der Sonderzeichen der RegEx-Pattern selber ist zusätzlich zu beachten (siehe dazu Referenz der verfügbaren Regex-Optionen)

Bei Fragen zu Regular Expressions nutzt bitte zu aller erst die gängigen Anleitungen im Netz bzw. die weiter oben erwähnte Referenz der mit dem Tool gültigen RegEx-Syntax.
Fragen solcher Art gehören bitte nicht in die Kommentare dieses Beitrags.

Das Tool kann frei und ohne Einschränkungen genutzt werden.

Hoffe das Programm nutzt dem ein oder anderen bei seinem Projekt.

So nun viel Spaß damit ...

Grüße @colinardo

Versionshistorie:

Version 0.8.0.50 vom 08.08.2013
(+) Parameter /group:n hinzugefügt um Gruppenmatching zu ermöglichen
(+) Parameter /global hinzugefügt. Standardmäßig wird ohne Verwendung von /global nur der erste Treffer geliefert.
(--) Parameter /first entfernt und durch /global ersetzt

Erst-Version vom 21.07.2013
- BatchRex-Erstausgabe
Ähnliche Inhalte
Entwicklung
gelöst Benötige Hilfe bei Regular Expression (6)

Frage von Thomas91 zum Thema Entwicklung ...

Batch & Shell
gelöst Batch - Warten bis bestimmter Task läuft (5)

Frage von Winfried-HH zum Thema Batch & Shell ...

Neue Wissensbeiträge
Windows Server

Umstellung SHA 1 auf SHA 2 - Migration der CA von CSP auf KSP

Tipp von Badger zum Thema Windows Server ...

Windows 10

Quato DTP94 unter Windows 10 x64 installieren und verwenden

Anleitung von anteNope zum Thema Windows 10 ...

Windows 10

Win10 1703 und Nutzerkennwörter bei Ersteinrichtung - erstaunliche Erkenntnis

(15)

Erfahrungsbericht von DerWoWusste zum Thema Windows 10 ...

Heiß diskutierte Inhalte
Festplatten, SSD, Raid
gelöst Raid-Controller (Areca) Datenverlust trotz R5 (16)

Frage von sebastian2608 zum Thema Festplatten, SSD, Raid ...

Server-Hardware
HP ProLiant DL380 G7, POST Error: 1785-Drive Array not Configured (10)

Frage von Paderman zum Thema Server-Hardware ...

Server-Hardware
Starker PC zum Virtualisieren (10)

Frage von canlot zum Thema Server-Hardware ...

Microsoft Office
gelöst Office 365 Pro Domäne einrichten OHNE Webseite (9)

Frage von thklemm zum Thema Microsoft Office ...