93578
Goto Top

Wie kann man 2 Textdateien vergleichen (OHNE SORTIERUNG!) und die gleiche Zeilen in einer Datei lassen und den Rest löschen?

Ich habe 2 Textdateien mit deutschen Wörtern. Erste Datei ist nach Häufigket von Wörtern sortiert (frequency list) und zweite nach Alphabet (A-Z).

Mein Problem:

Datei 1 enthält Wörter, die nach ihre Häufigkeit sortiert sind. Diese Datei ist größer als die Datei 2.

Datei 2 enthält Wörter, die alphabetisch (A-Z) sortiert sind. Sie ist kleiner als Datei 2.

Der Wortbestand in beiden Dateien ist nicht ganz identisch, jedoch hat ca. 75% Übereinstimmungen.

Ich will:

1) Dateien vergleichen

2) In der Datei 1 nur solche Wörter lassen, die in der Datei 2 vorhanden sind. Der Rest soll gelöscht werden.

3) Die Wörter in der Datei 1 sollen in ihrer usprunglichen Reihenfolge bleiben (also es sollte vorher nichts sortiert werden - sonst verliert man die Reihenfolge).

Wie kann man es tun? Kann mir jemand helfen?


Datei 1:

ich
sie
das
ist
du
nicht
die
es
und
der
wir
was
zu
er
ein
in
mir
mit
arbeit
den
dokumente
personal

Datei 2:

aber
auf
das
dass
den
der
die
du
ein
eine
er
es
haben
hat
hier
ich
in
ist
ja
mich
mir
mit
nicht
sie
so
und
was
wie
wir
zu

Das Endergebnis soll so aussehen (Datei 1):

ich
sie
das
ist
du
nicht
die
es
und
der
wir
was
zu
er
ein
in
mir
mit
den

Content-Key: 334001

Url: https://administrator.de/contentid/334001

Ausgedruckt am: 28.03.2024 um 11:03 Uhr

Mitglied: BassFishFox
BassFishFox 03.04.2017 um 19:46:32 Uhr
Goto Top
Hallo,

Bin zu faul heute selbst viel zu suchen. face-wink

https://forum.ubuntuusers.de/topic/doppelte-eintraege-aus-einer-datei-en ...
https://wiki.ubuntuusers.de/Textdateien_vergleichen/

Ackere Dich da durch und lass das sortieren wech.

BFF
Mitglied: 132692
Lösung 132692 03.04.2017 aktualisiert um 20:11:01 Uhr
Goto Top
grep -wf Datei1.txt Datei2.txt
Gruß p.
Mitglied: Spirit-of-Eli
Lösung Spirit-of-Eli 03.04.2017 um 20:38:43 Uhr
Goto Top
Hm Notepad++ kann das doch mit dem Compare Plugin.
Mitglied: BassFishFox
BassFishFox 03.04.2017 um 20:39:13 Uhr
Goto Top
Och p.

So eine schoene Antwort und dann..... face-wink

Wie war die Werbung? "Ob er jemals wieder kommt?"

BFF
Mitglied: BassFishFox
BassFishFox 03.04.2017 um 20:41:51 Uhr
Goto Top
face-wink

Der TO benutzt wohl ein Ubuntu.

OK, NPP++ wuerde ja per WINE laufen.

BFF
Mitglied: Spirit-of-Eli
Spirit-of-Eli 03.04.2017 um 20:44:30 Uhr
Goto Top
Oh Sorry wenn ich mein Wissen in dem Moment nicht derart erweitert habe als das ich mich erkundigt hätte ob es Notepad++ für Ubuntu gibt.

Dieses Standart Tool gehört doch sonst immer ins repertuar.
Mitglied: Kraemer
Kraemer 03.04.2017 um 21:05:07 Uhr
Goto Top
Mitglied: Lochkartenstanzer
Lochkartenstanzer 03.04.2017 um 21:11:03 Uhr
Goto Top
man grep

lks
Mitglied: 93578
93578 04.04.2017 aktualisiert um 11:37:48 Uhr
Goto Top
Ich habe EmEditor und kann zwar vergleichen, aber wie ich da löschen kann - bleibt ein Geheimnis... Zu unverständlich und nicht selbst erklärend für mich... Notepad++ werde ich ausprobieren, danke!
Mitglied: 93578
93578 04.04.2017 um 11:38:17 Uhr
Goto Top
Werde heute abends testen. Danke!
Mitglied: 93578
93578 04.04.2017 um 11:39:54 Uhr
Goto Top
Die Sachen kenne ich schon, aber sort und diff helfen in diesem Fall nicht. Danke.