Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Ghostscript pdfwrite zu txt wird in UCS-2 Little Endian konvertiert

Frage Entwicklung Batch & Shell

Mitglied: majcho

majcho (Level 1) - Jetzt verbinden

15.11.2011 um 15:28 Uhr, 4102 Aufrufe, 3 Kommentare

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne liegen

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne, liegen diese in UCS-2 Little Endian vor. Jetzt würde ich gerne auf der Commandozeilenebene diese in UTF-8 oder ANSI umwandeln. Gibt es ein einfaches dos-script das dies erledigt?
Mitglied: 60730
15.11.2011 um 15:31 Uhr
ja
Bitte warten ..
Mitglied: manni04
15.11.2011 um 22:14 Uhr
Ist zwar kein dos-skript aber vielleicht hilft dir das ja auch weiter:

01.
Const Path = "file.txt" 
02.
 
03.
Const adTypeBinary = 1 
04.
Const adTypeText = 2 
05.
Const adSaveCreateOverWrite = 2 
06.
  
07.
Dim BinaryStream, Text 
08.
     
09.
Set BinaryStream = CreateObject("ADODB.Stream") 
10.
         
11.
With BinaryStream 
12.
    .Type = adTypeText 
13.
    .Charset = "UTF-16" 
14.
    .Open 
15.
    .LoadFromFile Path 
16.
     Text = .ReadText 
17.
    .Close 
18.
End With 
19.
         
20.
With BinaryStream 
21.
    .Type = adTypeText 
22.
    .Charset = "x-Ansi" 
23.
    .Open 
24.
    .WriteText Text 
25.
    .SaveToFile Path, adSaveCreateOverWrite 
26.
    .Close 
27.
End With
Das einfach als .vbs-Datei abspeichern.

Grüße manni
Bitte warten ..
Mitglied: majcho
16.11.2011 um 10:40 Uhr
Hallo Manni04,

danke für deine Antwort. Leider hatte ich erfolglose und fehlerhafte Versuche mit Jodconverter und libiconv. Ich bin ein script-rookie so wie TimoBeil, der mit seiner Antwort einen Profi in mir vermutet. Dein Script habe ich auch erfolgreich umsetzen können, jedoch stieß ich an meine Grenzen mit einer Routine. Deshalb habe ich mir aus mehreren Beiträgen dieses Forums eine eigene Konstruktion zusammengebastelt, die sicher verbesserungswürdig ist.

01.
:: derzeitige Codepage speichern 
02.
for /f "tokens=2 delims=:" %%i in ('chcp') do set /a oemcp=%%~ni 
03.
:: auf ANSI wechseln 
04.
>nul chcp 1252 
05.
 
06.
FOR /F "delims=" %%i in ('dir /a-d /b /s "*.txt"') do ( 
07.
type %%i > %%ia ) 
08.
ren *.txta *.rtf 
09.
del *.txt 
10.
ren *.rtf *.txt 
11.
 
12.
:: zurück nach ASCII 
13.
>nul chcp %oemcp%
Bitte warten ..
Ähnliche Inhalte
Java
Net user per script aus txt oder csv für FTP (4)

Frage von OlliPWS zum Thema Java ...

Batch & Shell
Per Batch eine XLS-Datei in eine TXT-Datei umwandeln (5)

Frage von skiing69 zum Thema Batch & Shell ...

Batch & Shell
gelöst Zeiten in .txt datei auslesen und Differenz berechnen (14)

Frage von meex87 zum Thema Batch & Shell ...

Batch & Shell
gelöst Vorhandene TXT per Batch aktualisieren (6)

Frage von kampen zum Thema Batch & Shell ...

Neue Wissensbeiträge
RedHat, CentOS, Fedora

Fedora, RedHat, Centos: DNS-Search Domain setzen

(13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...

Drucker und Scanner

Samsung SL-M4025ND, firmware update und (kompatible) Tonerkassetten

(1)

Erfahrungsbericht von markus-1969 zum Thema Drucker und Scanner ...

Heiß diskutierte Inhalte
Windows 10
Windows für Privatanwender "nicht mehr handhabbar" (35)

Frage von FA-jka zum Thema Windows 10 ...

LAN, WAN, Wireless
Komplett neues Netzwerk, Ubiquiti WLAN, Router, Switch (15)

Frage von Freak-On-Silicon zum Thema LAN, WAN, Wireless ...

Backup
Backup Wochen- Monats- Jahressicherung (13)

Frage von Meterpeter zum Thema Backup ...

RedHat, CentOS, Fedora
Fedora, RedHat, Centos: DNS-Search Domain setzen (13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...