Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Ghostscript pdfwrite zu txt wird in UCS-2 Little Endian konvertiert

Frage Entwicklung Batch & Shell

Mitglied: majcho

majcho (Level 1) - Jetzt verbinden

15.11.2011 um 15:28 Uhr, 4086 Aufrufe, 3 Kommentare

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne liegen

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne, liegen diese in UCS-2 Little Endian vor. Jetzt würde ich gerne auf der Commandozeilenebene diese in UTF-8 oder ANSI umwandeln. Gibt es ein einfaches dos-script das dies erledigt?
Mitglied: 60730
15.11.2011 um 15:31 Uhr
ja
Bitte warten ..
Mitglied: manni04
15.11.2011 um 22:14 Uhr
Ist zwar kein dos-skript aber vielleicht hilft dir das ja auch weiter:

01.
Const Path = "file.txt" 
02.
 
03.
Const adTypeBinary = 1 
04.
Const adTypeText = 2 
05.
Const adSaveCreateOverWrite = 2 
06.
  
07.
Dim BinaryStream, Text 
08.
     
09.
Set BinaryStream = CreateObject("ADODB.Stream") 
10.
         
11.
With BinaryStream 
12.
    .Type = adTypeText 
13.
    .Charset = "UTF-16" 
14.
    .Open 
15.
    .LoadFromFile Path 
16.
     Text = .ReadText 
17.
    .Close 
18.
End With 
19.
         
20.
With BinaryStream 
21.
    .Type = adTypeText 
22.
    .Charset = "x-Ansi" 
23.
    .Open 
24.
    .WriteText Text 
25.
    .SaveToFile Path, adSaveCreateOverWrite 
26.
    .Close 
27.
End With
Das einfach als .vbs-Datei abspeichern.

Grüße manni
Bitte warten ..
Mitglied: majcho
16.11.2011 um 10:40 Uhr
Hallo Manni04,

danke für deine Antwort. Leider hatte ich erfolglose und fehlerhafte Versuche mit Jodconverter und libiconv. Ich bin ein script-rookie so wie TimoBeil, der mit seiner Antwort einen Profi in mir vermutet. Dein Script habe ich auch erfolgreich umsetzen können, jedoch stieß ich an meine Grenzen mit einer Routine. Deshalb habe ich mir aus mehreren Beiträgen dieses Forums eine eigene Konstruktion zusammengebastelt, die sicher verbesserungswürdig ist.

01.
:: derzeitige Codepage speichern 
02.
for /f "tokens=2 delims=:" %%i in ('chcp') do set /a oemcp=%%~ni 
03.
:: auf ANSI wechseln 
04.
>nul chcp 1252 
05.
 
06.
FOR /F "delims=" %%i in ('dir /a-d /b /s "*.txt"') do ( 
07.
type %%i > %%ia ) 
08.
ren *.txta *.rtf 
09.
del *.txt 
10.
ren *.rtf *.txt 
11.
 
12.
:: zurück nach ASCII 
13.
>nul chcp %oemcp%
Bitte warten ..
Neuester Wissensbeitrag
Off Topic

"Ich habe nichts zu verbergen"

(2)

Erfahrungsbericht von FA-jka zum Thema Off Topic ...

Ähnliche Inhalte
Microsoft Office
gelöst Excel VBA: Automatische Konvertierung von Textdatei (.txt) zu Exceldatei (.xlsx) (7)

Frage von Booster07 zum Thema Microsoft Office ...

Batch & Shell
Maximale Größe zu verarbeitender txt-Dateien mit Batch (5)

Frage von Muck1303 zum Thema Batch & Shell ...

Linux
Erster Meilenstein von UCS 4.2 veröffentlicht (1)

Link von Marenaba zum Thema Linux ...

Heiß diskutierte Inhalte
Linux Netzwerk
gelöst DHCP vergibt keine Adressen (32)

Frage von Maik82 zum Thema Linux Netzwerk ...

Apache Server
gelöst Lets Encrypt SSL mit Apache2 (20)

Frage von banane31 zum Thema Apache Server ...

CPU, RAM, Mainboards
Kaufberatung für mind. 8 verschiedene HighEnd-Mainboards (20)

Frage von yperiu zum Thema CPU, RAM, Mainboards ...

Mac OS X
Mac kann nicht im LAN pingen alle anderen schon (14)

Frage von smartino zum Thema Mac OS X ...