Iconv Charset-Konvertierung funktioniert nicht - Umlaute werden nicht korrekt dargestellt. Was tun?
Hallo,
ich habe auf einem Ubuntu-Server 14.xxx eine Datei, die laut dem Befehl 'file dateiname1.xml' so kodiert ist:
HTML document, UTF-8 Unicode text, with very long lines
Diese Datei benötige ich in ISO-8859-15. Dafür führe ich folgenden Befehl aus:
iconv -f UTF-8 -t ISO-8859-15//TRANSLIT dateiname1.xml > dateiname2.xml
Danach ist die dateiname2.xml laut 'file dateiname2.xml' so kodiert:
HTML document, ISO-8859 text, with very long lines
In der Eingabedatei waren die Umlaut korrekt dargestellt, in der Ausgabedatei sind sie hingegen defekt.
Woran liegt das und wie kann ich das beheben?
Bin für jeden Hinweis dankbar - Grüße
Thomas
ich habe auf einem Ubuntu-Server 14.xxx eine Datei, die laut dem Befehl 'file dateiname1.xml' so kodiert ist:
HTML document, UTF-8 Unicode text, with very long lines
Diese Datei benötige ich in ISO-8859-15. Dafür führe ich folgenden Befehl aus:
iconv -f UTF-8 -t ISO-8859-15//TRANSLIT dateiname1.xml > dateiname2.xml
Danach ist die dateiname2.xml laut 'file dateiname2.xml' so kodiert:
HTML document, ISO-8859 text, with very long lines
In der Eingabedatei waren die Umlaut korrekt dargestellt, in der Ausgabedatei sind sie hingegen defekt.
Woran liegt das und wie kann ich das beheben?
Bin für jeden Hinweis dankbar - Grüße
Thomas
Please also mark the comments that contributed to the solution of the article
Content-Key: 283962
Url: https://administrator.de/contentid/283962
Printed on: April 28, 2024 at 02:04 o'clock
2 Comments
Latest comment
Woran liegt das und wie kann ich das beheben?
Das liegt daran, dass dein Terminal-Programm UTF-8 für die Textausgabe verwendet.
Das Terminal kann nicht magisch "erkennen" was für einen Zeichensatz die dargestellten Inhalte haben.
Dass die Umlaute jetzt "defekt" sind, ist allerhöchstens ein Indiz dafür, dass die Konvertierung funktioniert hat.
Wenn du es genau wissen willst, kopier die Datei auf deinen Rechner und öffne sie in einem Editor mit Zeichensatz-Support (Notepad++, Textmate, Sublime Text, ...)