Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

Ghostscript pdfwrite zu txt wird in UCS-2 Little Endian konvertiert

Frage Entwicklung Batch & Shell

Mitglied: majcho

majcho (Level 1) - Jetzt verbinden

15.11.2011 um 15:28 Uhr, 4069 Aufrufe, 3 Kommentare

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne liegen

Habe mit dem neuen Ghostscript 9.04 sehr gute resultate in der Umwandlung von Textbasierten .pdf-Dateien in .txt erzielen können. Wenn ich allerdings diese Textdateien mit Notepad++ öffne, liegen diese in UCS-2 Little Endian vor. Jetzt würde ich gerne auf der Commandozeilenebene diese in UTF-8 oder ANSI umwandeln. Gibt es ein einfaches dos-script das dies erledigt?
Mitglied: 60730
15.11.2011 um 15:31 Uhr
ja
Bitte warten ..
Mitglied: manni04
15.11.2011 um 22:14 Uhr
Ist zwar kein dos-skript aber vielleicht hilft dir das ja auch weiter:

01.
Const Path = "file.txt" 
02.
 
03.
Const adTypeBinary = 1 
04.
Const adTypeText = 2 
05.
Const adSaveCreateOverWrite = 2 
06.
  
07.
Dim BinaryStream, Text 
08.
     
09.
Set BinaryStream = CreateObject("ADODB.Stream") 
10.
         
11.
With BinaryStream 
12.
    .Type = adTypeText 
13.
    .Charset = "UTF-16" 
14.
    .Open 
15.
    .LoadFromFile Path 
16.
     Text = .ReadText 
17.
    .Close 
18.
End With 
19.
         
20.
With BinaryStream 
21.
    .Type = adTypeText 
22.
    .Charset = "x-Ansi" 
23.
    .Open 
24.
    .WriteText Text 
25.
    .SaveToFile Path, adSaveCreateOverWrite 
26.
    .Close 
27.
End With
Das einfach als .vbs-Datei abspeichern.

Grüße manni
Bitte warten ..
Mitglied: majcho
16.11.2011 um 10:40 Uhr
Hallo Manni04,

danke für deine Antwort. Leider hatte ich erfolglose und fehlerhafte Versuche mit Jodconverter und libiconv. Ich bin ein script-rookie so wie TimoBeil, der mit seiner Antwort einen Profi in mir vermutet. Dein Script habe ich auch erfolgreich umsetzen können, jedoch stieß ich an meine Grenzen mit einer Routine. Deshalb habe ich mir aus mehreren Beiträgen dieses Forums eine eigene Konstruktion zusammengebastelt, die sicher verbesserungswürdig ist.

01.
:: derzeitige Codepage speichern 
02.
for /f "tokens=2 delims=:" %%i in ('chcp') do set /a oemcp=%%~ni 
03.
:: auf ANSI wechseln 
04.
>nul chcp 1252 
05.
 
06.
FOR /F "delims=" %%i in ('dir /a-d /b /s "*.txt"') do ( 
07.
type %%i > %%ia ) 
08.
ren *.txta *.rtf 
09.
del *.txt 
10.
ren *.rtf *.txt 
11.
 
12.
:: zurück nach ASCII 
13.
>nul chcp %oemcp%
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(1)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Batch & Shell
Batch-Variable nach Stichworten aus TXT Datei durchsuchen (3)

Frage von Markus5579 zum Thema Batch & Shell ...

Webentwicklung
gelöst HTML Output in eine txt Datei mit VisualBasicScript (2)

Frage von coca22COCA zum Thema Webentwicklung ...

Batch & Shell
Merkwürdige Zeilenformatierung in txt Datei (3)

Frage von miczar zum Thema Batch & Shell ...

Entwicklung
gelöst Get ip from external txt file and use in vbscript (5)

Frage von thankusomuch zum Thema Entwicklung ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
gelöst Server erkennt Client nicht wenn er ausserhalb des DHCP Pools liegt (28)

Frage von Mar-west zum Thema LAN, WAN, Wireless ...

Outlook & Mail
Outlook 2010 findet ost datei nicht (18)

Frage von Floh21 zum Thema Outlook & Mail ...

Windows Server
Server 2008R2 startet nicht mehr (Bad Patch 0xa) (18)

Frage von Haures zum Thema Windows Server ...