Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Datensätze ordnen

Mitglied: xfrostx

xfrostx (Level 1) - Jetzt verbinden

10.10.2007, aktualisiert 17.10.2007, 3168 Aufrufe, 6 Kommentare

Hallo zusammen,
da ich fast keine ahnung von programmierung habe und mich hier auch nicht durchlesen konnte. muss ich euch um einen kleinen rat, vielleicht sogar um eine lösung bitten.
also ich habe einen kunden der 8000000 Datensätze hat die total ungeordnet in eienr .txt datei abgelegt sind. diese datensätze sehen so aus! diese sollen oder können in irgend ein programm eingelesen werden zum verarbeiten, nur muss nach dem ordnen diese dateien wieder in einer .txt datei ausgegeben werden.

225356373
a2 1
a3 1
b4 2
aaa 1


22345643
fsf 1
djud 1
uzt 1
tae 2
gtw 1
kts 1
dtr 1

Man sieht, das z.b. vor der 22345643 ein leerzeichen ist, dies ist bei jedem datensatz unterschiedlich, mal ist ein leerzeichen da mal ist kein vorhanden...
dadrunter diese --> fsf djud und 1 etc. müssen nun hinter diese lange zahl angeordnet werden.

z.b. so...
225356373 a21 a31 b42 aaa1
22345643 fsf1 djud1 uzt1 tae2 etc.

es ist egal ob diese durch ein leerzeichen oder in komma getrennt werden.

es wär sehr schön von euch wenn ihr mir eine lösung vorschlagen oder schon schreiben könntet.

vielen dank schonmal

frosty
Mitglied: bastla
12.10.2007 um 22:08 Uhr
Hallo xfrostx!

Unter der Annahme, dass je Datensatz eine gleich bleibende Anzahl von Zeilen (lt Deinem Beispiel etwa 8) in der Textdatei steht, könntest Du es mit folgendem VBScript versuchen:
01.
Const Ein = "D:\Daten.txt" 
02.
Const Aus = "D:\Daten.csv" 
03.
Const Zeilen = 8 
04.
Const Delim = "," 
05.
 
06.
Set fso = CreateObject("Scripting.FileSystemObject") 
07.
Set oEin = fso.OpenTextFile(Ein, 1) 
08.
set oAus = fso.OpenTextFile(Aus, 2, True) 
09.
 
10.
Do While Not oEin.AtEndOfStream 
11.
	sZeile = Trim(oEin.ReadLine) 
12.
	For i = 1 To Zeilen - 1 
13.
		If Not oEin.AtEndOfStream Then 
14.
			sZeile = sZeile & Delim & Replace(oEin.ReadLine, " ", "") 
15.
		End If 
16.
	Next 
17.
	oAus.WriteLine sZeile 
18.
Loop 
19.
oEin.Close 
20.
oAus.Close 
21.
WScript.Echo "Fertig."
Das gewünschte Trennzeichen kannst Du in der Zeile
01.
Const Delim = ","
festlegen.

Grüße
bastla
Bitte warten ..
Mitglied: Biber
15.10.2007 um 21:55 Uhr
Moin xfrostx,

ich weiß ja nicht, ob Du vorhast ein Feedback zu liefern - viele machen das ja von sich aus.
Da ich auch Dir ja nur die besten Absichten unterstelle, lass mich doch gleich nochmal nachfragen:

Du erwähntest, dass Du zwar schon mindestens einen Kunden hast, aber keinen Plan, wie Du diese mäßig strukturierten Daten ordnen willst.

Bei 8 Millionen Datensätzen hast Du doch aber vermutlich wenigstens eine ungefähre Vorstellung, wo Du damit hinwillst...

Diese Rumsortiererei in eine Zeile pro "Datensatz" ist ja schon ganz rührend und schadet ja auch bestimmt nichts, aber wenn Dein gepostetes Beispielfragment halbwegs lebensnah ist, dann steht doch nach der identifizierenden Nummer auch Zeugs, das doch wohl auch Äpfel und Birnen beschreibt. Und so kaum in Datenbankfelder eingelesen werden kann.

So wie gepostet macht jedenfalls der ganze Aufwand keinen Sinn - magst Du nicht lieber den ganzen Sachverhalt schildern und Deinen Plan, damit umzugehen?

Denn die Übertragbarkeit einer auf die obige Beschreibung zusammengeharkten Skriptlösung auf eventuelle Probleme anderer Forumsmitglieder sehe ich bis jetzt eher gering.

Grüße
Biber
Bitte warten ..
Mitglied: xfrostx
16.10.2007 um 12:26 Uhr
Hallo,

sorry erstmal das ich erst so spät zurückschreibe, habe aber momentan soviel um die ohren. aber ich kann euch verstehen .

ja ne, das funktioniert so auch nicht, weil mit einer konstanten von acht zu arbeiten ist sinnlos. die zeilen varieren... man muss mit ner freien variablen arbeiten. aber die idee es in eine csv datei auszugeben ist schon ganz gut. vielleicht habt ihr da ja noch ne ahnung wie wir das hinbekommen könnten.
Bitte warten ..
Mitglied: SvenGuenter
17.10.2007 um 09:22 Uhr
Hast du keinen fixen Delemiter den man nehmen kann um zu erkennen wann der eine Datensatz aufhört udn der andere anfängt? Normalerweise wird das doch gemacht. Also ein <CR> oder ein <CRLF>

Wenn da keiner ist fällt mir kein Weg ein auch nur ansatzweise eine sichere Lösung zu finden die sauber die Datensätze trennt.

Gruß

Sven
Bitte warten ..
Mitglied: Biber
17.10.2007 um 09:30 Uhr
Moin Sven,

der nächstschlechtere Plan wäre dann der Versuch der Identifizierung der Pseudo-IDs ( oben im Bsp "22345643" oder so ähnlich) - wenn das die einzigen Zeilen sind, die nur aus Ziffern (und trailing blanks) bestehen.

Nichtsdestotrotz - ich sehe dennoch noch nichts, was ich einem potentiellen Kunden gegenüber auch nur scherzhaft als Konzept verkaufen könnte.

Erstmal alle Datensätze in eine Zeile zu bringen und dann mal sehen... wenn das der ganze Plan für 8 Mio Datensätze ist, dann warte ich lieber auf Plan B.

Grüße
Biber
Bitte warten ..
Mitglied: SvenGuenter
17.10.2007 um 09:40 Uhr
Hi Biber,

die Idee kam mir auch schon aber sicher ist dies nicht wenn in der Folgezeile auch auf Einmal was mit einer Zahl beginnt.


Dieses nur nach Zahlen schauen kann sehr in die Hose gehen und ist wie gesagt sehr ungenau meines erachtens. Ich weiß nicht wie du dadrüber denkst.
Man müßte mal einen Teil der Datei im Original sehen dann kann man sich da besser Gedanken drüber machen, da ich schon oft erlebt habe das Poster nicht alle Dateiinformationen gepostet haben oder diese nicht sehen konnten weil sie nicht mit UltraEdit32 oder ähnlichen Tools gearbeitet haben.


Gruß

Sven
Bitte warten ..
Ähnliche Inhalte
Datenbanken

SQL: Anzahl von Datensätzen bei JOIN

Frage von BirdyBDatenbanken2 Kommentare

Hallo zusammen, ich stehe gerade etwas auf dem Schlauch und hoffe auf eure Hilfe. Gegeben sind in unserer SQL ...

Microsoft Office

Serienbrief Nächster Datensatz Wenn

Frage von Druide83Microsoft Office2 Kommentare

Hallo, ist das erste mal dass ich mit Serienbriefen in Word zu tun habe und mir fehlt auch nur ...

Datenbanken

Datensatz hinzufügen, nicht überschreiben Access

gelöst Frage von Dr.CornwallisDatenbanken19 Kommentare

Liebe Gemeinde, ich habe folgenden Code (bei Button klick): Wähle ich mit diesem Code einen anderen Wert im Kombifeld ...

Datenbanken

SQL: Wenn Datensatz älter als . dann

gelöst Frage von nepixlDatenbanken5 Kommentare

Guten Morgen werte Community, habe den Auftrag erhalten, eine kleine Userdatenbank für ein Portal zu bauen. Das klappt auch ...

Neue Wissensbeiträge
Humor (lol)
(Part num your Hacked phone. +XX XXXXXX5200)
Erfahrungsbericht von Henere vor 13 StundenHumor (lol)1 Kommentar

Mein Handy hat aber ne ganz andere Endnummer. Muss ich mir jetzt Sorgen machen ? :-) Vielleicht betrifft es ...

Exchange Server

Letztes Update für Exchange 2016 CU9 war in gewisser Weise destruktiv

Erfahrungsbericht von DerWoWusste vor 15 StundenExchange Server6 Kommentare

Kurzer Erfahrungsbericht zu Exchange2016-KB4340731-x64 Der Exchangeserver hat wie gewöhnlich versucht, es in der Nacht automatisch zu installieren - abgesehen ...

Erkennung und -Abwehr

Neue Sicherheitslücke Foreshadow (L1TF) gefährdet fast alle Intel-Prozessoren

Information von Frank vor 1 TagErkennung und -Abwehr3 Kommentare

Eine neue Sicherheitslücke, genannt Foreshadow (alias L1TF) wurde auf der Usenix Security 18 von einem Team internationaler Experten veröffentlicht. ...

Vmware
VMware Updates gegen L1 Lücke
Information von sabines vor 1 TagVmware

Für die Vmware Produkte vCenter Server, ESXi, Workstation und Fusion stehe Updates bereit um die L1 Lücke zu schließen. ...

Heiß diskutierte Inhalte
Windows Server
Domäne einsilbig mit nur einem Namen benannt - sowie AD und MX auf einer VM Kardinalsfehler?
Frage von TomTestWindows Server48 Kommentare

Hallo liebe Freunde gepflegter Probleme, seit kurzem soll ich eine Domäne verwalten die zuvor von einem IT-Dienstleister erstellt und ...

Microsoft
VPN Verbindung kann nicht aufgebaut werden
Frage von AlexderITlerMicrosoft35 Kommentare

Hallo, Ich möchte an einem unserer PCs in unserer Tochterfirma eine VPN zu unserem Netzwerk einrichten. Das schlägt allerdings ...

Windows Server
Windows Server per Web auf Daten zugreifen und verwalten
Frage von matze2090Windows Server16 Kommentare

Hallo, ich würde gerne von außen auf meinem Windows Server zugreifen um auf meine Daten zu verwalten. Meine frage ...

DNS
Gibt es eine Art DNS Proxy?
Frage von icepietDNS16 Kommentare

Hallo Nerds, Ich würde gerne folgendes machen: ts.domain.de:3389 soll auf 1.2.3.4:3389 auflösen ts2.domain.de:3389 soll auf 1.2.3.4:3390 auflösen Gibt es ...