Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit
GELÖST

2 Excel-Tabellen mit jeweise mehr als 45.000 Datensätzen ohne Dubletten zusammenführen

Frage Microsoft Microsoft Office

Mitglied: Sylvia

Sylvia (Level 1) - Jetzt verbinden

08.11.2007, aktualisiert 09.11.2007, 12340 Aufrufe, 4 Kommentare

mehr als 65.xxx geht ja nicht.. Excel 2003

Hallo

Wir haben 2 Tabellen mit Adressen ohne eindeutigen Schlüssel, die wir in einer Tabelle zusammenführen müssen.
Von den jeweils mehr als 45.000 Datensätzen sind nur 6.000 etwa NICHT absolut identisch, die anderen sind absolut identisch.
Hat jemand eine Idee, wie ich die 6.000 rausfinden kann ? Die Doppelten können ruhig wegfallen. (Access vorhanden)

(Beide in eine Tabelle und ohne Dubletten filtern geht wegen der großen Menge nicht)

Grüße
Sylvia
Mitglied: bastla
08.11.2007 um 22:22 Uhr
Hallo Sylvia!

In welchen Spalten stehen die Adressen?
Gibt es Adressen, die ein Semikolon enthalten?
Bedeutet "absolut identisch", dass auch Groß- und Kleinschreibung übereinstimmen?

Grüße
bastla
Bitte warten ..
Mitglied: Sylvia
08.11.2007 um 23:28 Uhr
Hallo bastla,

ja, absolut identisch heisst halt absolut identisch auch in der Groß-Kleinschreibung - ist ein Export aus dem gleichen Datenbestand.
Ein Semikolon enthalten die Daten nicht (soweit ich weiss Tab-getrennt) aber man kann sie als csv exportieren wenn nötig...
Name, Vorname, Strasse, plz, ort alles steht in einem eigenen Feld und die Daten die gleich sind sind auch wirklich gleich.
Grüße
Sylvia
Bitte warten ..
Mitglied: bastla
09.11.2007 um 00:06 Uhr
Hallo Sylvia!

Versuchen wir's über .csv:
Alle in weiterer Folge genannten Dateien sind in den selben Ordner zu speichern.

- Speichere die erste Tabelle als "Adr1.csv" (im Format CSV (Trennzeichen-getrennt) (*.csv))
- Speichere analog dazu die zweite Tabelle als "Adr2.csv".
- Speichere das folgende VBScript unter "AdrFiltern.vbs"
01.
Set fso = CreateObject("Scripting.FileSystemObject") 
02.
Set InFile = fso.OpenTextFile(WScript.Arguments(0), 1) 
03.
Set OutFile = fso.OpenTextFile(WScript.Arguments(1), 2, True) 
04.
Latest = "" 
05.
Do Until InFile.AtEndOfStream 
06.
	Line = InFile.ReadLine 
07.
	If Line = Latest Then 
08.
		Latest = "" 
09.
	Else 
10.
		If Latest <> "" Then OutFile.WriteLine Latest 
11.
		Latest = Line 
12.
	End If 
13.
Loop 
14.
If Latest <> "" Then OutFile.WriteLine Latest 
15.
InFile.Close 
16.
OutFile.Close
- Speichere den folgenden Batch als "Make.bat":
01.
copy Adr1.csv + Adr2.csv Adr12.txt 
02.
sort Adr12.txt /o Adr.txt 
03.
AdrFiltern.vbs Adr.txt Adr.csv 
04.
del Adr12.txt 
05.
start Adr.csv
- Starte den Batch "Make.bat" per Doppelklick.
- Wenn alles geklappt hat, öffnet sich Excel mit der CSV-Datei "Adr.csv" mit den "einzigartigen" Adressen (die idententischen Datensätze sollten jeweils alle beide verworfen worden sein).

Grüße
bastla
Bitte warten ..
Mitglied: Sylvia
09.11.2007 um 09:20 Uhr
Super !
vielen, vielen Dank, Du hast mir damit echt sehr geholfen !! Es tut !

Grüße

Sylvia
Bitte warten ..
Ähnliche Inhalte
Microsoft Office
Excel Daten aus diversen Tabellen sammeln (9)

Frage von FitforLife zum Thema Microsoft Office ...

Microsoft Office
Excel Dateien durchsuchen und Teile extrahieren (5)

Frage von Beranavan zum Thema Microsoft Office ...

Microsoft Office
gelöst Suchfunktion Excel einbauen (6)

Frage von lupi1989 zum Thema Microsoft Office ...

Microsoft Office
gelöst Micorsoft Excel: Variable Anzeige von mehreren Werten anhand von Stammdaten (1)

Frage von sammy65 zum Thema Microsoft Office ...

Neue Wissensbeiträge
Batch & Shell

Batch zum Zurücksetzen eines lokalen Profils

Tipp von Mr.Error zum Thema Batch & Shell ...

RedHat, CentOS, Fedora

Fedora, RedHat, Centos: DNS-Search Domain setzen

(13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
VPN Tunnel aufbauen (16)

Frage von Hajo2006 zum Thema LAN, WAN, Wireless ...

Microsoft Office
Saubere HTML aus Word-Dokument (14)

Frage von peterpa zum Thema Microsoft Office ...

Router & Routing
ASUS RT-N18U mit VPN Client hinter Fritzbox - Portforwarding (14)

Frage von marshall75000 zum Thema Router & Routing ...

E-Mail
gelöst Probleme beim E-Mail Empfang (12)

Frage von TommyB83 zum Thema E-Mail ...