knobi
Goto Top

Vergleich von zwei CSV-Dateien und Schreiben der Änderungen in eine dritte CSV-Datei

Hallo User

Ich arbeite auf Windows XP. Nun möchte ich zwei CSV Dateien zeilenweise miteinander vergleichen, wobei nur die geänderten Zeilen in Datei 2 (gegenüber Datei 1) in eine separate dritte CSV-Datei geschrieben werden. Datei 3 soll dann nur die geänderten Zeilen aus Datei 2 enthalten.
Der Dateivergleich über fc bringt mir nicht das gewünschte Ergebnis.
Sicher lässt sich eine Lösung über eine Batchdatei oder ein geeignetes Tool finden?
Könnt ihr mir Tips geben oder Lösungsmöglichkeiten?
Vielen Dank im Vorraus

Knobi

Content-Key: 24660

Url: https://administrator.de/contentid/24660

Printed on: April 23, 2024 at 11:04 o'clock

Member: gooogix
gooogix Jan 27, 2006 at 13:34:39 (UTC)
Goto Top
Hallo!

Ich benutze für CSV-Dateien oft das Tool CSVed:

http://home.hccnet.nl/s.j.francke/t2t/text2table.htm

Evtl. hilft Dir das bei der Lösung.

Gruss
Udo
Member: netstorm
netstorm Jan 27, 2006 at 14:37:59 (UTC)
Goto Top
Hallo,

unter Linux würde ich sowas mit Perl oder diff machen. Beides gibt es auch für Windows.

Bei Perl mußt Du noch ein passendes Script schreiben. Diff ist ein Package, daß sich eben genau um das Vergleichen von Dateien kümmert. In deinem Fall wäre also diff sicher die passendere Lösung. Schau also mal unter: http://gnuwin32.sourceforge.net/packages/diffutils.htm

Solltest Du doch Interesse an Perl haben, sag einfach nochmal bescheid. Ansonsten kannst du dir auch mal diesen Thread anschauen: Hat zwar nix mit deinem konkreten Problem zu tun, aber da kannste mal gucken wie ein Perlscript aussieht:

CIAO Thorsten
Member: maneich
maneich Jan 28, 2006 at 11:09:13 (UTC)
Goto Top
Hallo,

mit einem VBS sollte das auch klappen:

snip!!
Set fs =CreateObject("Scripting.FileSystemObject")
Set f1 = OpenTextFile("Pfad\csv1.csv")
Set f2 = OpenTextFile("Pfad\csv2.csv")
Set f3 = OpenTextFile("Pfad\scv3.csv", 2, True)
do
da1 = f1.ReadLine
da2 = f2.ReadLine
x1 = StrComp(da1, da2, 0) '0 = binärer- / 1 = text-Vergleich = testen was für Dich besser ist
If x1 <> 0 Then
f3.WriteLine da2
End If
Loop Until f1.AtEndOfStream
f1.Close
f2.Close
f3.Close
WScript.Quit
snap!!

wenn Datei f2 mehr Zeilen haben kann als f1 mußt Du eben unter Loop noch einfügen

do
f3.WriteLine f2.ReadLine
Loop Until f2.AtEndOf Stream

MfG maneich
Member: knobi
knobi Jan 30, 2006 at 14:47:54 (UTC)
Goto Top
Hallo Udo,

Danke für den Tip. Habe das Tool installiert.
Allerdings weigerte sich CSVed die CSV-Datei zu öffnen, weil sie angeblich leer ist, was natürlich nicht der Fall ist.

Im Tool habe ich aber auch noch keine Einstellung gesehen, wo ich zwei CSV-Dateien vergleichen kann.

Trotzdem Danke für den Tip. Bestimmt kann ich das Tool mal an anderer Stelle brauchen.

Gruß Knobi
Member: paed
paed Apr 21, 2006 at 09:24:10 (UTC)
Goto Top
Hi,

Bei Perl mußt Du noch ein passendes
Script schreiben. Diff ist ein Package,
daß sich eben genau um das Vergleichen
von Dateien kümmert.
das gibt's schon, schau dir mal http://csvdiff.sourceforge.net/ an. Du kannst bei csv diff (mehrere) Key-Spalten angeben, Gross/Kleinschreibung ignorieren, fuehrenden oder nachlaufende Leerzeichen ignorieren, oder geziehlt Spalten fuer den Vergleich ausblenden. Das Ausblenden ist z.B. fuer Spalten gut, die dich "eh nicht interessieren" (z.B. Timestamps), so prodozieren diese Spalten keine "unnuetzen" Meldungen, das sich dieser Datensatz veraendert hat.

In deinem Fall
wäre also diff sicher die passendere
Lösung. Schau also mal unter:
http://gnuwin32.sourceforge.net/packages/diffutils.htm
Das sehe ich anders.
Diff hat nur wenig zu bieten was die Syncronisation angeht, wenn in einer der Dateien (viele) Zeilen hinzukommen, wegfallen oder sich aendern, wird's haarig. Das Ergebnis wird auch schnell unbrauchbar, wenn die Reihenfolge der Datensaetze in den Dateien unterschiedlich ist. Dann kommt diff schnell "aus dem Tritt". Ausserdem Weisst du so nur welche Zeile(n) sich unterscheiden. Wenn die Zeile "sehr lang" ist bzw. viele Felder enthaelt, ist es schoener wenn dir gleich die Stelle praesentiert wird, die unterschiedlich ist, oder?


Viel Erfolg

Paed