hanswurstaugust
Goto Top

CSV Datei in UTF-8 umwandeln

Hallo,

ich versuche gerade ein kleines Skript zu basteln, das mir eine CSV Datei in eine UTF-8 Datei umwandelt.
Dazu tat ich folgendes:

1. Um den Zeichensatz zu überprüfen habe ich die Windows Portierung des Unix Programmes File installiert. File - test.csv zeigt mir an das die Datei im ASCII Format ist. soweit sogut...
2. Für die Umwandlung von ASCII in UTF-8 lud mir die Windows Portierung von iconv (Libiconv) herunter. So sollte das konvertieren gehen:

iconv.exe -f ascii -t utf-8 test.cvs -o test.cvs

Man gibt den alten Zeichensatz an, dann den Zeichensatz den man gerne hätte und Ausgangs- u. Zieldatei. Anstatt dann eine neue Datei zu erzeugen, meckert das Tool nur das test2.cvs nicht existiert. Kopiere ich test.csv und benenne Kopie in test.csv in test2.csv um funktioniert es allerdings leider auch nicht.

Die test2.csv ist danach immer noch im ASCII Format?

Mache ich was falsch? Gibt es vielleicht andere KOmmandozeilen Tools die dies einfacher erledigen?

Man dankt!

Content-Key: 184433

Url: https://administrator.de/contentid/184433

Printed on: April 20, 2024 at 01:04 o'clock

Member: SHuesken
SHuesken May 03, 2012 at 14:53:59 (UTC)
Goto Top
Hallo HansWurstAugust,

versuch doch einmal folgende Zeile:

iconv.exe -f ascii -t utf-8 test.csv > utf8.csv

Normal müsste es damit gehen.

Gruss
Stefan

EDIT: Typo

MANPAGE zum Tool: http://www.mkssoftware.com/docs/man1/iconv.1.asp
Member: HansWurstAugust
HansWurstAugust May 03, 2012 at 15:13:04 (UTC)
Goto Top
Hallo Shuesken,

Danke, jetzt meckert das Tool nicht mehr. Nur wenn ich jetzt mit File.exe den Zeichensatz abfrage sehe ich immer noch ASCII.

file utf8.csv
utf8.csv; ASCII text, with CRLF line terminators

Wir kommen der Sache aber schon näher^^

Zudem ist die neue .csv Datei leer! Also ich meine mich zu erinnern, das ich das vor Jahren innerhalb von 5 Minuten so ähnlich mit Linux gemacht habe... Leider gottes ham wir auf dem ARbeitsplatz worum es geht Windows ;-(
Member: HansWurstAugust
HansWurstAugust May 04, 2012 at 07:42:59 (UTC)
Goto Top
Also mit Notepad oder Scite kann ich die DAtei als UTF-8 with Bom encoden. Das klappt. Ist aber ein manueller Schritt und anscheinend nicht zu skripten oder?

Kennt sonst noch wer ne gute Möglichkeit? Interessant noch, mir fällt auf das in Scite nur UTF-8 with bom geht. Notepad erzeugt automatisch UTF-8 with BOM wenn ich es als UTF-8 encoden will... Iconv kann es garnicht als UTF-8 speichern, UTF-16 geht komischerweise....