Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Felder mit Werten aus Dubletten füllen

Frage Microsoft Microsoft Office

Mitglied: HeinzWiedermann

HeinzWiedermann (Level 1) - Jetzt verbinden

15.03.2007, aktualisiert 21:35 Uhr, 2943 Aufrufe, 3 Kommentare

Guten Morgen zusammen,

ich möchte (d.h. ich muss) überprüfen, ob in einer Dublette eines Datensatzes evtl. in einem der Felder ein Wert vorhanden ist, der in meinem Original nicht vorhanden ist. Konkretes Beispiel:

Lisa Müller hat im Original eine Festnetznummer, aber keine Mobilfunknummer, in einer der 5 Dubletten in der Datenbank ist es umgekehrt; Mobilfunknummer, aber keine Festnetznummer.

Ich habe ca. 1,5 Millionen Datensätze mit ca. 2,5 Millionen Dubletten, jeweils mit unterschiedlichen Werten in einigen Feldern. Wie verdichte ich diese Informationen jetzt auf einen Datensatz?

Dank im Voraus
Mitglied: Biber
15.03.2007 um 14:17 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei uns im Norden das Wort Dubletten irgendwie eine geringfügig andere Bedeutung zu haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original- und "Dubletten"-Lisa-Müller-Sätze? Vorname und Name? Kundennummer?
- Wenn in einem FeldX in dem "Dubletten"-Satz ein wert steht und im Original kein Wert, dann ist automatisch der "Dubletten"-Satz richtig(er)?
-wenn dazu mehrere Dubletten existieren, dann hat zweite Dublette mehr Wahrheit in sich als die erste, aber weniger als die als drittes gelesene????

Kannst Du mal so ein bis anderthalb Zeilen zum Hintergrund dieser Daten-"Abgleichs"-Mimik erzählen?

Danke
Biber
Bitte warten ..
Mitglied: HeinzWiedermann
15.03.2007 um 14:44 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei
uns im Norden das Wort Dubletten irgendwie
eine geringfügig andere Bedeutung zu
haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original-
und
"Dubletten"-Lisa-Müller-Sätze?
Vorname und Name? Kundennummer?

Die Gemeinsamkeit definiert sich über Name, Straße, Hnr, PLZ.

- Wenn in einem FeldX in dem
"Dubletten"-Satz ein wert steht und
im Original kein Wert, dann ist automatisch
der "Dubletten"-Satz richtig(er)?

Sogesehen schon. Die Daten sind in alle in Ordnung und in dem für mich richtigen Format bzw standardisiert. Mir ist es wichtig, die Informationen in einem Datensatz zu bündeln.

-wenn dazu mehrere Dubletten existieren,
dann hat zweite Dublette mehr Wahrheit in
sich als die erste, aber weniger als die als
drittes gelesene????

Darüber habe ich mir auch schon Gedanken gemacht. Grundsätzlich hätte ich aber erstmal einen Lösungsansatz. Gehen wir also davon aus, dass es keine 'richtigeren' werte gibt, sondern nur 0 und 1 und ich nur jeweils den ersten gefundenen Wert brauche. Sollte ein Wert ebenfalls in einer anderen Dublette stehen, so wird dieser ignoriert.


Kannst Du mal so ein bis anderthalb Zeilen
zum Hintergrund dieser
Daten-"Abgleichs"-Mimik
erzählen?

Danke
Biber
Bitte warten ..
Mitglied: Biber
15.03.2007 um 21:35 Uhr
Hmmm,
dann ist es jetzt eine Frage der Strategie bzw. der Risikobereitschaft.

Angenommen, es gäbe noch 20 weitere Felder außer den Schlüsselfeldern, dann
- (für Vewegene) könnte eine Mimik sein, den "Original"-Satz in ALLEN Feldern zu aktualisieren, wenn in Original-Feld1 nichts und in Dubletten-Feld1 etwas steht ODER in O-Feld2 nichts und in D-Feld2 etwas ODER...usw usw.
Dabei wäre es aber fast unausweichlich, dass auch mal gefüllte Felder in der O-Datei übernagelt werden mit leeren Feldinhalten der D-Datei
-(für Ängstlichere) das feldweise Vorgehen: Wenn Schlüsselfelder gleich und in D-Feld1 steht etwas und in O-Feld1 nichts, dann dieses eine Feld updaten in der O-Datei.

Irgendwelche Vorlieben?

Gruss
Biber
Bitte warten ..
Ähnliche Inhalte
Batch & Shell
Zusammenführen mehrere Felder, Datei auswählen (1)

Frage von GeoSem zum Thema Batch & Shell ...

Datenbanken
Informix SE Tabelle alle Felder auf NULL prüfen (4)

Frage von RalfHackmann zum Thema Datenbanken ...

Microsoft Office
gelöst Micorsoft Excel: Variable Anzeige von mehreren Werten anhand von Stammdaten (1)

Frage von sammy65 zum Thema Microsoft Office ...

Windows Userverwaltung
gelöst Active Directory: Basisordner automatisch füllen lassen? (5)

Frage von Rene12345 zum Thema Windows Userverwaltung ...

Neue Wissensbeiträge
Heiß diskutierte Inhalte
Windows Systemdateien
NTFS und die Defragmentierung (26)

Frage von WinLiCLI zum Thema Windows Systemdateien ...

LAN, WAN, Wireless
Zwei Subnetze mit je eigenem Router und Internetzugang verbinden (18)

Frage von hannsgmaulwurf zum Thema LAN, WAN, Wireless ...

Windows Server
WIndows Server 2016 core auf dem Intel NUC NUC5i5RYK i5 5250U (17)

Frage von IxxZett zum Thema Windows Server ...