Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Felder mit Werten aus Dubletten füllen

Frage Microsoft Microsoft Office

Mitglied: HeinzWiedermann

HeinzWiedermann (Level 1) - Jetzt verbinden

15.03.2007, aktualisiert 21:35 Uhr, 2929 Aufrufe, 3 Kommentare

Guten Morgen zusammen,

ich möchte (d.h. ich muss) überprüfen, ob in einer Dublette eines Datensatzes evtl. in einem der Felder ein Wert vorhanden ist, der in meinem Original nicht vorhanden ist. Konkretes Beispiel:

Lisa Müller hat im Original eine Festnetznummer, aber keine Mobilfunknummer, in einer der 5 Dubletten in der Datenbank ist es umgekehrt; Mobilfunknummer, aber keine Festnetznummer.

Ich habe ca. 1,5 Millionen Datensätze mit ca. 2,5 Millionen Dubletten, jeweils mit unterschiedlichen Werten in einigen Feldern. Wie verdichte ich diese Informationen jetzt auf einen Datensatz?

Dank im Voraus
Mitglied: Biber
15.03.2007 um 14:17 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei uns im Norden das Wort Dubletten irgendwie eine geringfügig andere Bedeutung zu haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original- und "Dubletten"-Lisa-Müller-Sätze? Vorname und Name? Kundennummer?
- Wenn in einem FeldX in dem "Dubletten"-Satz ein wert steht und im Original kein Wert, dann ist automatisch der "Dubletten"-Satz richtig(er)?
-wenn dazu mehrere Dubletten existieren, dann hat zweite Dublette mehr Wahrheit in sich als die erste, aber weniger als die als drittes gelesene????

Kannst Du mal so ein bis anderthalb Zeilen zum Hintergrund dieser Daten-"Abgleichs"-Mimik erzählen?

Danke
Biber
Bitte warten ..
Mitglied: HeinzWiedermann
15.03.2007 um 14:44 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei
uns im Norden das Wort Dubletten irgendwie
eine geringfügig andere Bedeutung zu
haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original-
und
"Dubletten"-Lisa-Müller-Sätze?
Vorname und Name? Kundennummer?

Die Gemeinsamkeit definiert sich über Name, Straße, Hnr, PLZ.

- Wenn in einem FeldX in dem
"Dubletten"-Satz ein wert steht und
im Original kein Wert, dann ist automatisch
der "Dubletten"-Satz richtig(er)?

Sogesehen schon. Die Daten sind in alle in Ordnung und in dem für mich richtigen Format bzw standardisiert. Mir ist es wichtig, die Informationen in einem Datensatz zu bündeln.

-wenn dazu mehrere Dubletten existieren,
dann hat zweite Dublette mehr Wahrheit in
sich als die erste, aber weniger als die als
drittes gelesene????

Darüber habe ich mir auch schon Gedanken gemacht. Grundsätzlich hätte ich aber erstmal einen Lösungsansatz. Gehen wir also davon aus, dass es keine 'richtigeren' werte gibt, sondern nur 0 und 1 und ich nur jeweils den ersten gefundenen Wert brauche. Sollte ein Wert ebenfalls in einer anderen Dublette stehen, so wird dieser ignoriert.


Kannst Du mal so ein bis anderthalb Zeilen
zum Hintergrund dieser
Daten-"Abgleichs"-Mimik
erzählen?

Danke
Biber
Bitte warten ..
Mitglied: Biber
15.03.2007 um 21:35 Uhr
Hmmm,
dann ist es jetzt eine Frage der Strategie bzw. der Risikobereitschaft.

Angenommen, es gäbe noch 20 weitere Felder außer den Schlüsselfeldern, dann
- (für Vewegene) könnte eine Mimik sein, den "Original"-Satz in ALLEN Feldern zu aktualisieren, wenn in Original-Feld1 nichts und in Dubletten-Feld1 etwas steht ODER in O-Feld2 nichts und in D-Feld2 etwas ODER...usw usw.
Dabei wäre es aber fast unausweichlich, dass auch mal gefüllte Felder in der O-Datei übernagelt werden mit leeren Feldinhalten der D-Datei
-(für Ängstlichere) das feldweise Vorgehen: Wenn Schlüsselfelder gleich und in D-Feld1 steht etwas und in O-Feld1 nichts, dann dieses eine Feld updaten in der O-Datei.

Irgendwelche Vorlieben?

Gruss
Biber
Bitte warten ..
Neuester Wissensbeitrag
Windows 10

Powershell 5 BSOD

(1)

Tipp von agowa338 zum Thema Windows 10 ...

Ähnliche Inhalte
Microsoft Office
Excel VBA: Tranferieren von Werten aus Quelldatei in die Masterdatei mit SVERWEIS (3)

Frage von peter.schroeder zum Thema Microsoft Office ...

Batch & Shell
gelöst Set-ADUser - Füllen des Felds "Location" funktioniert nicht (2)

Frage von Alex94G zum Thema Batch & Shell ...

Batch & Shell
XML nach Liste mit Werten durchsuchen (12)

Frage von bocker zum Thema Batch & Shell ...

Datenbanken
gelöst SQL . 2 Felder bzw. Werte vergleichen und Rückmeldung 0 oder 1 (2)

Frage von wawidl zum Thema Datenbanken ...

Heiß diskutierte Inhalte
LAN, WAN, Wireless
gelöst Server erkennt Client nicht wenn er ausserhalb des DHCP Pools liegt (28)

Frage von Mar-west zum Thema LAN, WAN, Wireless ...

Outlook & Mail
Outlook 2010 findet ost datei nicht (18)

Frage von Floh21 zum Thema Outlook & Mail ...

Windows Server
Server 2008R2 startet nicht mehr (Bad Patch 0xa) (18)

Frage von Haures zum Thema Windows Server ...