93578
Jun 28, 2016, updated at 14:18:28 (UTC)
1638
4
0
Vor - und Nachnahmen aus einer Textdatei löschen, die in anderen Textdateien vorhanden sind
Hallo,
ich habe folgendes Problem: ich habe eine Textdatei mit mehr als 30.000.000.000 Zeilen. In eingigen von diesen Zeilen (nicht in jeder!!!) stehen NUR Vor- und Nachnahmen von Mitarbeiter in 4 verschiedenen Variationen:
Nun soll ich diese personenbezogene Daten löschen. Meine Idee war: 2 neue txt-Dateien (eine mit Vornahmen und und eine mit Nachnahmen von allen Mitarbeiter) erzeugen. Danach sie mit der ersten Textdatei abgleichen und alle Zeilen mit Übereinstimmungen aus der ersten Texdatei löschen.
comm-Befehl brachte mir diesmal nichts. Wie kann ich so was für Linux realisieren??? Ein zusätzliches Problem dabei: es sind sowohl Klein-, als auch Großbuchstaben als Anfangsbuchstaben in Namen vorhanden (siehe Beispiel).
Danke,
Takeshi
ich habe folgendes Problem: ich habe eine Textdatei mit mehr als 30.000.000.000 Zeilen. In eingigen von diesen Zeilen (nicht in jeder!!!) stehen NUR Vor- und Nachnahmen von Mitarbeiter in 4 verschiedenen Variationen:
klaus.mustermann
Ingo Mustermann
Heinz-mustermann
olaf_Mustermann
Nun soll ich diese personenbezogene Daten löschen. Meine Idee war: 2 neue txt-Dateien (eine mit Vornahmen und und eine mit Nachnahmen von allen Mitarbeiter) erzeugen. Danach sie mit der ersten Textdatei abgleichen und alle Zeilen mit Übereinstimmungen aus der ersten Texdatei löschen.
comm-Befehl brachte mir diesmal nichts. Wie kann ich so was für Linux realisieren??? Ein zusätzliches Problem dabei: es sind sowohl Klein-, als auch Großbuchstaben als Anfangsbuchstaben in Namen vorhanden (siehe Beispiel).
Danke,
Takeshi
Please also mark the comments that contributed to the solution of the article
Kommentar vom Moderator tomolpi am Jun 28, 2016 um 17:04:10 Uhr
Geschlossen, neuer Thread ist hier: https://www.administrator.de/frage/vor-nachnamen-bestimmten-muster-textd ...
tomolpi
tomolpi
Content-Key: 308393
Url: https://administrator.de/contentid/308393
Printed on: April 25, 2024 at 21:04 o'clock
4 Comments
Latest comment
Zitat von @93578:
Leider komme ich damit nicht weiter. Dort ist NUR 1 bestimmtes Merkmal vorhandne (192).
No there are multiple entries in the text file, all separated by a pipe symbol -> | !Leider komme ich damit nicht weiter. Dort ist NUR 1 bestimmtes Merkmal vorhandne (192).