Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Anleitung Entwicklung Batch & Shell

BatchRex - Regular Expressions in Batch nutzen (oder: Wie extrahiert man bestimmten Text)

Mitglied: colinardo

colinardo (Level 5) - Jetzt verbinden

21.07.2013, aktualisiert 25.04.2017, 9836 Aufrufe, 3 Danke

Da hier des öfteren Fragen in der Art "wie kann ich den String XY aus einem Text extrahieren" auftauchen, habe ich mich mal hingesetzt und ein Tool entwickelt das echte Regular Expressions in einer Batchdatei möglich macht. Ich nenne es mal passend : BatchRex.
Für all diejenigen die nur Batch nutzen (können/dürfen/sollen/wollen) soll das hier eine Erleichterung zum Extrahieren von speziellen Textfragmenten sein. Ich weiß es gibt da schon Tools wie "sed" - für manch einen Anfänger dürfte das jedoch Overkill sein.

Download

Das Tool kann hier kostenlos heruntergeladen werden
Aktuelle Version v0.8.0.50 vom 08.08.2013

Verwendung von BatchRex

BatchRex extrahiert Text anhand der Regular-Expression aus einem übergebenen String oder einer Textdatei und gibt die Treffer auf der Kommandozeile aus. Standardmäßig wird der erste Treffer in dem String ausgegeben. Sollen mehrere Vorkommen ausgegeben werden kann dies mit der Option /global erreicht werden.
Hinweise: Bei Verwendung der String-Option kann der Text nur aus einer Zeile bestehen und darf keine Zeilenumbrüche enthalten. Bitte beachtet auch die maximale Länge von 8.191 Zeichen die die Eingabeaufforderung akzeptiert. Sollen nur bestimmte Teile eines Patterns ausgegeben werden könnt Ihr das wie üblich mit Klammern () um den jeweiligen Part im Pattern machen. Außerdem kann mit dem Parameter /group:n die Gruppe ausgewählt werden welche ausgegeben werden soll.

BatchRex kennt folgende Kommandozeilen-Parameter:

Benötigte Parameter bei Übergabe eines Strings auf der Kommandozeile:
/string:"STRING DER DURCHSUCHT WERDEN SOLL" Text in dem gesucht werden soll
/pattern:"REGULAR EXPRESSION PATTERN" Regular Expression Pattern der den gesuchten Text extrahiert / Referenz der verfügbaren Regex-Optionen

Alternativ kann in einer Textdatei nach Text gesucht werden dann werden diese Parameter benötigt:
(Es kann nur eine der beiden Optionen genutzt werden: entweder /string oder /file)
Benötigte Parameter bei der Suche in einer Textdatei:
/file:"PFAD ZUR TEXTDATEI" Pfad zu einer Textdatei in der gesucht werden soll
/pattern:"REGULAR EXPRESSION PATTERN" Regular Expression Pattern der den gesuchten Text extrahiert / Referenz der verfügbaren Regex-Optionen

[Optionale Parameter]
/global Gibt alle Treffer des Pattern aus. Ohne diesen Parameter wird nur der erste Treffer des Pattern ausgegeben
/group:n Gibt die Gruppe mit der Nummer "n" innerhalb des Pattern an welche ausgegeben werden soll. Hierzu verwendet man Klammern im Pattern

Rückgabewerte
Zurückgegeben werden bei keinem Fehler die gefundenen Textstellen, ansonsten werden folgende Error-Codes zurückgegeben:

ERRORLEVEL Fehler
0 kein Fehler
1 Falsche Parameterverwendung
2 Keine passenden Fundstellen im Text
3 Syntaxfehler im Regular Expression Patttern
4 Datei existiert nicht
5 sonstiger Fehler

Beispiele

Beispiel 1: Die Verwendung in einer Batchdatei mit Übergabe eines Strings:

(Im Beispiel werden alle Telefonnummern extrahiert)
01.
@echo off 
02.
set "text=Dies ist der Text in dem gesucht wird Tel.: +49123456789 Tel.:+49987654321" 
03.
batchRex.exe /string:"%text%" /pattern:"Tel\.: ?(\+?\d*)" /global

Beispiel 2: Textdatei durchsuchen

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
batchRex.exe /file:"%datei%" /pattern:"Tel\.: ?(\+?\d*)" /global

Beispiel 3: Textdatei durchsuchen und nur ersten Treffer zurückgeben

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
batchRex.exe /file:"%datei%" /pattern:"Tel\.: ?(\+?\d*)"

Beispiel 4: Datei manuell Zeile für Zeile durchsuchen

01.
@echo off 
02.
set "datei=C:\Suchdatei.txt" 
03.
for /f "usebackq tokens=* delims=" %%f IN ("%datei%") DO ( 
04.
    batchRex.exe /string:"%%f" /pattern:"Tel\.: ?(\+?\d*)" 
05.
)
Achtung Sonderzeichen
Zu beachten sind die Batch-Sonderzeichen im Zusammenhang mit dem Pattern. Sollen diese z.B. in dem Pattern verwendet werden müssen diese "Escaped" werden. Das Escapen der Sonderzeichen der RegEx-Pattern selber ist zusätzlich zu beachten (siehe dazu Referenz der verfügbaren Regex-Optionen)

Bei Fragen zu Regular Expressions nutzt bitte zu aller erst die gängigen Anleitungen im Netz bzw. die weiter oben erwähnte Referenz der mit dem Tool gültigen RegEx-Syntax.
Fragen solcher Art gehören bitte nicht in die Kommentare dieses Beitrags.

Das Tool kann frei und ohne Einschränkungen genutzt werden.

Hoffe das Programm nutzt dem ein oder anderen bei seinem Projekt.

So nun viel Spaß damit ...

Grüße @colinardo

Versionshistorie:

Version 0.8.0.50 vom 08.08.2013
(+) Parameter /group:n hinzugefügt um Gruppenmatching zu ermöglichen
(+) Parameter /global hinzugefügt. Standardmäßig wird ohne Verwendung von /global nur der erste Treffer geliefert.
(--) Parameter /first entfernt und durch /global ersetzt

Erst-Version vom 21.07.2013
- BatchRex-Erstausgabe
Ähnliche Inhalte
Batch & Shell
Powershell - Text-to-Speech (Text zu Sprache)
Tipp von colinardoBatch & Shell3 Kommentare

Für alle die in Powershell ein Text-To-Speech benötigen, hier ein Code-Beispiel wie dies damit realisiert werden kann: Beispiel mit ...

Administrator.de Feedback
Entwicklertagebuch: Zitate, Text- und Codeblöcke
Information von admtechAdministrator.de Feedback8 Kommentare

Hi, heute habe ich ein paar sehr, sehr alte Fehler auf Administrator.de behoben. Sie stammen noch aus den Anfangszeiten ...

Microsoft Office
Text in Zahlen umwandeln
Tipp von logischeMicrosoft Office

Beim Import von Daten aus anderen Anwendungen kommt es häufig vor, dass Zahlen als Textwerte in der Excel-Tabelle erscheinen. ...

Papierkorb
Millionen Nutzer von Keyboard-App geleakt
Tipp von mathuPapierkorb1 Kommentar

vertrau nicht blind deinem (virtual) keyboard! Link von Heise.de

Neue Wissensbeiträge
Linux

Meltdown und Spectre: Linux Update

Information von Frank vor 2 TagenLinux

Meltdown (Variante 3 des Prozessorfehlers) Der Kernel 4.14.13 mit den Page-Table-Isolation-Code (PTI) ist nun für Fedora freigegeben worden. Er ...

Tipps & Tricks

Solutio Charly Updater Fehlermeldung: Das Abgleichen der Dateien in -Pfad- mit dem Datenobject ist fehlgeschlagen

Tipp von StefanKittel vor 2 TagenTipps & Tricks

Hallo, hier einmal als Tipp für alle unter Euch die mit der Zahnarztabrechnungssoftware Charly von Solutio zu tun haben. ...

Sicherheit

Meltdown und Spectre: Wir brauchen eine "Abwrackprämie", die die CPU-Hersteller bezahlen

Information von Frank vor 2 TagenSicherheit12 Kommentare

Zum aktuellen Thema Meltdown und Spectre: Ich wünsche mir von den CPU-Herstellern wie Intel, AMD oder ARM eine Art ...

Sicherheit

Meltdown und Spectre: Realitätscheck

Information von Frank vor 2 TagenSicherheit10 Kommentare

Die unangenehme Realität Der Prozessorfehler mit seinen Varianten Meltdown und Spectre ist seit Juni 2017 bekannt. Trotzdem sind immer ...

Heiß diskutierte Inhalte
E-Mail
Erfahrungen mit hMailServer gesucht
Frage von it-fraggleE-Mail10 Kommentare

Hallo, meine neue Stelle möchte einen eigenen Mailserver. Ich als Linuxkind war direkt geistig mit Postfix dabei. Leider wollen ...

Entwicklung
VBS: alle PDF-Dateien in einem Ordner gleichzeitig öffnen
gelöst Frage von JuweeeEntwicklung9 Kommentare

Hallo, ich habe in deiner Ordnerstruktur (.\Tagesberichte\xx.18\) mehrere dynamische PDF-Formulare (mit LCD erstellt). Die Berichtsformulare sind im Layout alle ...

Firewall
Penetrationstester-Labor - Firewalls
Frage von Oli-nuxFirewall9 Kommentare

Mich würde interessieren warum man beim Einrichten eines Penetrationstester-Labor (VMs) die Firewall der Systeme deaktivieren soll? Hat das nur ...

Netzwerkgrundlagen
IPv6 Inter-VLAN Routing
gelöst Frage von clSchakNetzwerkgrundlagen8 Kommentare

Hi ich befasse mich gerade mit der Implementierung von IPv6 was bisher (in einem VLAN) korrekt funktioniert inkl. DNS ...