grs533
Goto Top

txt Datei splitten

Hallo

Ich habe txt Dateien die folgendermaßen
(für mich momentan schlecht verwertbar) aufgebaut sind:

1dateiname1
blablablablalabla
blablablablalabla
1blablablabla
blablablablalabla

2dateiname2
blablablablalabla
blablablablalabla
2blablablabla
blablablablalabla
2blablalalabla
blablablablalabla
2blablablabla
blablablablalabla

3dateiname3
blablablablalabla
blablablablalabla
3blablablabla
blablablablalabla
3blablablabla
blablablablalabla


Ist es machbar solch eine Datei blockweise zu splitten?
Wobei die erste Zeile jedes Blocks der Dateiname der neuen Datei sein soll
und nicht mit in die neue 'Datei übernommen werden soll.
Anzahl und grösse der Blöcke variieren. Es ist jeweils nur eine Leerzeile dazwischen.
Eventuell nötige zusätzliche Zeichen kann ich sicher unterbringen.

Content-Key: 108852

Url: https://administrator.de/contentid/108852

Printed on: April 24, 2024 at 13:04 o'clock

Member: miniversum
miniversum Feb 12, 2009 at 17:57:03 (UTC)
Goto Top
Versuchs mal damit:
@echo off
set first=1

FOR /F "tokens=1*delims=:" %%i in ('findstr /n /r .* "text.txt"') do call:verarbeite "%%j"  
goto:eof

:verarbeite
if %first% equ 1 (
set first=0
set "filename=%~1.txt"  
) else (
if "%~1" equ "" (  
set first=1
) else (
(echo %~1)>>"%filename%"  
)
)
Sollten sonderzeichen "<>()&|" in der datei enthalten sein kann es zu problemen führen. Das müsste dan extra behandelt werden. Das gleiche gilt für die Dateinamen wenn dort Zeichen enthalten sidn die ncith erlaubt sind.
Member: GRS533
GRS533 Feb 12, 2009 at 18:39:33 (UTC)
Goto Top
Schonmal vielen Dank für deine investierte Zeit. face-smile

Der Dateiname ist immer ohne jegliche Sonderzeichen.
Im Rest können allerdings die 3 Zeichen &() vorkommen.
Ich hab aus der testdatei mal eben manuell die Sonderzeichen entfernt
und dann hat deine bat auch gleich astrein funktioniert. face-smile
Bliebe noch das Problem mit den 3 oben erwähnten Zeichen.
Member: miniversum
miniversum Feb 12, 2009 at 18:49:10 (UTC)
Goto Top
Dan versuchs mal damit:
@echo off
set first=1

FOR /F "tokens=1*delims=:" %%i in ('findstr /n /r .* "text.txt"') do call:verarbeite "%%j"  
goto:eof

:verarbeite
set "line=%~1"  
set "line=%line:^(=^^^(%"  
set "line=%line:^)=^^^)%"  
set "line=%line:^&=^^^&%"  

if %first% equ 1 (
set first=0
set "filename=%line%.txt"  
) else (
if "%line%" equ "" (  
set first=1
) else (
(echo %line%)>>"%filename%"  
)
)
Das ist jetzt ungetestet.
Member: GRS533
GRS533 Feb 12, 2009 at 19:33:57 (UTC)
Goto Top
So, jetzt habe ich mal willkürlich diese 3 Zeichen verteilt in unterschiedlichen Anordnungen.
Jetzt sieht es so aus:
Nach einem & fehlt der Rest der Zeile, nach der ersten geschlossenen Klammer ) der komplette Rest.
Die offenen Klammern ( werden alle korrekt dargestellt, ohne negative Auswirkungen auf den Text.
Mitglied: 67517
67517 Feb 12, 2009 at 20:46:49 (UTC)
Goto Top
Sry ich wollt mal fragen was des für ne Programiersprache is oder was des eben für Befehle sind =)
(ich weiß, dass die Frage hier eigendlich nichts zu suchen hat)
Member: bastla
bastla Feb 12, 2009 at 20:58:07 (UTC)
Goto Top
Hallo GRS533!

Vielleicht so:
@echo off & setlocal
set first=1

FOR /F "tokens=1* delims=:" %%i in ('findstr /n /r .* "text.txt"') do set "line=%%j" & call:verarbeite  
goto:eof

:verarbeite
if not defined line goto:auswertung
set "line=%line:&=^&%"  
set "line=%line:(=^(%"  
set "line=%line:)=^)%"  

:auswertung
if %first% equ 1 (
    set first=0
    set "filename=%line%.txt"  
) else (
    if not defined line (
        set first=1
    ) else (
        (echo %line%)>>"%filename%"  
    )
)
@67517
Das sind CMD-Befehle (die "CMD-Shell" ist der erheblich verbesserte Nachfolger der "MS-DOS-Eingabeaufforderung") , das "Programm" ist ein Batch mit dem Dateityp ".bat" oder ".cmd".

Grüße
bastla
Member: GRS533
GRS533 Feb 12, 2009 at 21:44:21 (UTC)
Goto Top
Klappt! face-smile


Ich danke euch vielmals für eure Mühe. face-smile
Member: GRS533
GRS533 Sep 05, 2009 at 16:13:24 (UTC)
Goto Top
Da bin ich wieder. :D
Mittlerweile gibt es noch mehr Zeichen die beachtet werden müssen, z. B. <>

Das konnte ich durch einfügen der folgenden Zeilen aber hin biegen:

set "line=%line:<=^<%"
set "line=%line:>=^>%"

Aber der Grund warum ich mich melde ist, dass ich jetzt eine Zeile habe die mich überfordert.
Hier ein Beispiel:
<bla="x:\bla\bla\bla(bla)"/>

Entferne ich beide Anführungszeichen oder die schließende Klammer wird die Zeile korrekt ausgelesen.
Irgendwie scheint die Reihenfolge der Zeichen auch eine Rolle zu spielen?
Eine andere Zeile in der die Zeichen statt wie hier " ( ) " in der Folge " " ( ) auftreten macht keine Probleme.

Ich hoffe jemand kennt des Rätsels Lösung (und teilt sie mir auch mit.) face-smile
Member: bastla
bastla Sep 05, 2009 at 16:36:51 (UTC)
Goto Top
Hallo GRS533!

Sieht so aus, als wäre die Zeit für ein VBScript gekommen ... face-wink
EinDatei = "D:\text.txt"  
Ziel = "D:\Gesplittet"  
Ext = ".txt"  

Set fso = CreateObject("Scripting.FileSystemObject")  
T = Split(fso.OpenTextFile(EinDatei).ReadAll, vbCrLF & vbCrLF)
For i = 0 To UBound(T)
    A = Split(T(i), vbCrLF)
    If UBound(A) > 0 Then 
        If A(0) <> "" Then  
            Set AusDatei = fso.CreateTextFile(Ziel & "\" & A(0) & Ext, True)  
            For j = 1 To UBound(A)
                AusDatei.WriteLine A(j)
            Next
            AusDatei.Close
        End If
    End If
Next
Vorausgesetzt wird, dass es tatsächlich genau eine Leerzeile zwischen den Blöcken gibt und dass der Zielordner (im Beispiel "D:\Gesplittet") bereits existiert. Außerdem muss (wie bisher) die erste Zeile des Blocks einen gültigen Dateinamen liefern. Sollte im Zielordner bereits eine gleichnamige Datei vorhanden sein, wird diese (derzeit) kommentarlos überschrieben.

Grüße
bastla
Member: GRS533
GRS533 Sep 05, 2009 at 20:39:24 (UTC)
Goto Top
Zuerst ein Danke für deine Mühe face-smile

Beim ersten Versuch erhielt ich die Meldung "Für die Dateierweiterung ".vbs" gibt es kein Scriptmodul."
Habe dann die ganze Geschichte wie in diversen Foren beschrieben neu installiert und und und.., jetzt hagelt es Fehlermeldungen wegen nicht registrierter Bibliotheken.
VB mag mich nicht. :/

Falls ich es noch zum laufen bekomme, vorab ein paar Fragen:
Das Ziel ist grundsätzlich der Ordner in dem die Datei ausgeführt wird.
Kann man den Eintrag dann einfach leer lassen? Ziel = ""
Und die Extension kann variieren und wird von der ersten Zeile jeden Blocks der ursprünglichen .txt vorgegeben. Auch leer lassen oder entfällt die Zeile ganz?
Es ist genau eine Leerzeile zwischen den Blöcken und der Ordner existiert, in ihm liegt die Datei.

Davon abgesehen habe ich von VB absolut keine Ahnung.
Siehst du eventuell nicht doch für eine batch-Datei eine Chance? :D
Member: bastla
bastla Sep 05, 2009 at 21:07:46 (UTC)
Goto Top
Hallo GRS533!

Um als Zielpfad den Ordner vorzugeben, in welchem das Script selbst liegt sowie die Extension aus der Datei zu übernehmen, wären folgende Änderungen nötig:

Zeile 2:
Ziel = Replace(WScript.ScriptFullName, WScript.ScriptName, "")
Zeile 3: kann entfallen

Zeile 11:
Set AusDatei = fso.CreateTextFile(Ziel & A(0), True)
Siehst du eventuell nicht doch für eine batch-Datei eine Chance? :D
Mit den oben beschriebenen Zeichen-Kombinationen ist die Grenze, bis zu der ich mir das noch per Batch antun wollte, überschritten ...

Grüße
bastla

P.S.: Die Downloadlinks für VBS wirst Du vermutlich schon gefunden haben - falls nicht:
2000, XP, 2003
Member: GRS533
GRS533 Sep 08, 2009 at 19:52:34 (UTC)
Goto Top
Genau, diese Links hatte ich gefunden (unter anderem), aber keine Chance, bis jetzt geht noch nichts und mein System will ich deswegen auch nicht neu aufsetzen. Ich geb's auf ... face-sad
Die viele Rumsucherei hat aber auch gezeigt, dass solche Probleme keine Seltenheit zu sein scheinen, deshalb denke ich, dass VBS für mein Vorhaben auch grundsätzlich nicht so gut geeignet ist.

Daher bedanke ich mich sehr für die von dir investierte Zeit und hoffe dass sich vielleicht doch noch jemand findet der die Geschichte per batch realisieren kann. face-smile