chrislm
Goto Top

Zwei dateien auf Dubletten untersuchen.

Hallo.
Ich suche eine Möglichkeit 2 Dateien auf Dubletten zu untersuchen. Es gibt eine große Masterdatei und eine kleine die mit dieser abgeglichen werden soll. Entweder erstelle ich eine neue Datei oder lösche die Dubletten in der kleinen, das wäre mir egal.

Ich habe ein Post gefunden, leider ist es nur zum zusammenführen:
2 Excel-Tabellen mit jeweise mehr als 45.000 Datensätzen ohne Dubletten zusammenführen
kann man das irgendwie für meine Bedürfnisse abändern...?

Content-Key: 182419

Url: https://administrator.de/contentid/182419

Printed on: April 23, 2024 at 18:04 o'clock

Member: d4shoerncheN
d4shoerncheN Mar 22, 2012 at 10:41:18 (UTC)
Goto Top
Um was für eine Art "Datei" handelt es sich denn?
Member: chrislm
chrislm Mar 22, 2012 at 10:46:52 (UTC)
Goto Top
Kommt als Excel, kann daraus auch eine CSV oder so machen...
Member: mak-xxl
mak-xxl Mar 22, 2012 at 13:06:00 (UTC)
Goto Top
Moin chrisIM,

ich lese im angegebenen Link die Aufgabenstellung "... Die Doppelten können ruhig wegfallen ..."

Bei Dir doch auch - schreibst Du also in eine csv-Datei (wie dort auch) und machst diese dann (nach einem letzten Kontrollblick) zur zweiten?! Die originalen Tabellen bleiben durch das Script unberührt.

Freundliche Grüße von der Insel - Mario
Member: bastla
bastla Mar 22, 2012 at 13:29:48 (UTC)
Goto Top
@mario

Nicht ganz - im verlinkten Beitrag ging es darum, die Datensätze aus beiden Dateien zusammenzufassen, ohne dabei Dupikate zu erhalten, wogegen hier - ja was soll denn hier eigentlich genau das Ergebnis sein?

Vermuten würde ich ja, dass alle Datensätze aus der "kleinen" Datei, die nicht in der "Masterdatei" enthalten sind, in die Ergebnisdatei geschrieben werden sollen ...

Grüße
bastla
Member: mak-xxl
mak-xxl Mar 22, 2012 at 13:35:45 (UTC)
Goto Top
Zitat von @bastla:

Nicht ganz - im verlinkten Beitrag ging es darum, die Datensätze aus beiden Dateien zusammenzufassen, ohne dabei Dupikate zu erhalten ...

@bastla

Moin - Davon bin ich auch ausgegangen: Masterfile bleibt - Ablegerfile entsteht neu (wird aufgefüllt und von Dubletten befreit).

Wenn aber ... Na schaun wir mal, dann werden wir schon sehen ...

Freundliche Grüße von der Insel - Mario
Member: bastla
bastla Mar 22, 2012 at 13:45:04 (UTC)
Goto Top
Hallo Mario!
Na schaun wir mal, dann werden wir schon sehen ...
Irgendwie halte ich die Spannung nicht mehr aus face-wink:
findstr /v /x /g:Master.csv Kleine.csv>Duplikatfrei.csv
Grüße
bastla
Member: chrislm
chrislm Mar 22, 2012 at 14:44:45 (UTC)
Goto Top
Vielen dank für die Antworten.
ich bin erst einmal Platt wegen der kleinen Zeile vom Bastla, ich habe es getestet und sie scheint wohl wirklich die Doppler zu finden. aber ich muss noch den Härtetest machen...
Member: mak-xxl
mak-xxl Mar 22, 2012 at 15:21:31 (UTC)
Goto Top
@ bastla,

ich habe beim zwischenzeitlichen Kaffetrinken mit <fc> (in Gedanken!) rumgemacht und ein schwülstiges Konstrukt zur Auswertung des resultierenden Bithaufens errichtet - mittlerweile entsorgt (>NUL 2>&1).
Danke für den Schubs in Richtung 'back to the roots'.

Freundliche Grüße von der Insel - Mario