Top-Themen

AppleEntwicklungHardwareInternetLinuxMicrosoftMultimediaNetzwerkeOff TopicSicherheitSonstige SystemeVirtualisierungWeiterbildungZusammenarbeit

Aktuelle Themen

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

Felder mit Werten aus Dubletten füllen

Frage Microsoft Microsoft Office

Mitglied: HeinzWiedermann

HeinzWiedermann (Level 1) - Jetzt verbinden

15.03.2007, aktualisiert 21:35 Uhr, 2938 Aufrufe, 3 Kommentare

Guten Morgen zusammen,

ich möchte (d.h. ich muss) überprüfen, ob in einer Dublette eines Datensatzes evtl. in einem der Felder ein Wert vorhanden ist, der in meinem Original nicht vorhanden ist. Konkretes Beispiel:

Lisa Müller hat im Original eine Festnetznummer, aber keine Mobilfunknummer, in einer der 5 Dubletten in der Datenbank ist es umgekehrt; Mobilfunknummer, aber keine Festnetznummer.

Ich habe ca. 1,5 Millionen Datensätze mit ca. 2,5 Millionen Dubletten, jeweils mit unterschiedlichen Werten in einigen Feldern. Wie verdichte ich diese Informationen jetzt auf einen Datensatz?

Dank im Voraus
Mitglied: Biber
15.03.2007 um 14:17 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei uns im Norden das Wort Dubletten irgendwie eine geringfügig andere Bedeutung zu haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original- und "Dubletten"-Lisa-Müller-Sätze? Vorname und Name? Kundennummer?
- Wenn in einem FeldX in dem "Dubletten"-Satz ein wert steht und im Original kein Wert, dann ist automatisch der "Dubletten"-Satz richtig(er)?
-wenn dazu mehrere Dubletten existieren, dann hat zweite Dublette mehr Wahrheit in sich als die erste, aber weniger als die als drittes gelesene????

Kannst Du mal so ein bis anderthalb Zeilen zum Hintergrund dieser Daten-"Abgleichs"-Mimik erzählen?

Danke
Biber
Bitte warten ..
Mitglied: HeinzWiedermann
15.03.2007 um 14:44 Uhr
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei
uns im Norden das Wort Dubletten irgendwie
eine geringfügig andere Bedeutung zu
haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original-
und
"Dubletten"-Lisa-Müller-Sätze?
Vorname und Name? Kundennummer?

Die Gemeinsamkeit definiert sich über Name, Straße, Hnr, PLZ.

- Wenn in einem FeldX in dem
"Dubletten"-Satz ein wert steht und
im Original kein Wert, dann ist automatisch
der "Dubletten"-Satz richtig(er)?

Sogesehen schon. Die Daten sind in alle in Ordnung und in dem für mich richtigen Format bzw standardisiert. Mir ist es wichtig, die Informationen in einem Datensatz zu bündeln.

-wenn dazu mehrere Dubletten existieren,
dann hat zweite Dublette mehr Wahrheit in
sich als die erste, aber weniger als die als
drittes gelesene????

Darüber habe ich mir auch schon Gedanken gemacht. Grundsätzlich hätte ich aber erstmal einen Lösungsansatz. Gehen wir also davon aus, dass es keine 'richtigeren' werte gibt, sondern nur 0 und 1 und ich nur jeweils den ersten gefundenen Wert brauche. Sollte ein Wert ebenfalls in einer anderen Dublette stehen, so wird dieser ignoriert.


Kannst Du mal so ein bis anderthalb Zeilen
zum Hintergrund dieser
Daten-"Abgleichs"-Mimik
erzählen?

Danke
Biber
Bitte warten ..
Mitglied: Biber
15.03.2007 um 21:35 Uhr
Hmmm,
dann ist es jetzt eine Frage der Strategie bzw. der Risikobereitschaft.

Angenommen, es gäbe noch 20 weitere Felder außer den Schlüsselfeldern, dann
- (für Vewegene) könnte eine Mimik sein, den "Original"-Satz in ALLEN Feldern zu aktualisieren, wenn in Original-Feld1 nichts und in Dubletten-Feld1 etwas steht ODER in O-Feld2 nichts und in D-Feld2 etwas ODER...usw usw.
Dabei wäre es aber fast unausweichlich, dass auch mal gefüllte Felder in der O-Datei übernagelt werden mit leeren Feldinhalten der D-Datei
-(für Ängstlichere) das feldweise Vorgehen: Wenn Schlüsselfelder gleich und in D-Feld1 steht etwas und in O-Feld1 nichts, dann dieses eine Feld updaten in der O-Datei.

Irgendwelche Vorlieben?

Gruss
Biber
Bitte warten ..
Ähnliche Inhalte
Windows Userverwaltung
gelöst Active Directory: Basisordner automatisch füllen lassen? (5)

Frage von Rene12345 zum Thema Windows Userverwaltung ...

Datenbanken
gelöst SQL-Abfrage und leere Felder vermeiden (12)

Frage von zwangseinweisung zum Thema Datenbanken ...

Neue Wissensbeiträge
RedHat, CentOS, Fedora

Fedora, RedHat, Centos: DNS-Search Domain setzen

(13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...

Drucker und Scanner

Samsung SL-M4025ND, firmware update und (kompatible) Tonerkassetten

(1)

Erfahrungsbericht von markus-1969 zum Thema Drucker und Scanner ...

Heiß diskutierte Inhalte
Windows 10
Windows für Privatanwender "nicht mehr handhabbar" (35)

Frage von FA-jka zum Thema Windows 10 ...

LAN, WAN, Wireless
Komplett neues Netzwerk, Ubiquiti WLAN, Router, Switch (15)

Frage von Freak-On-Silicon zum Thema LAN, WAN, Wireless ...

Backup
Backup Wochen- Monats- Jahressicherung (13)

Frage von Meterpeter zum Thema Backup ...

RedHat, CentOS, Fedora
Fedora, RedHat, Centos: DNS-Search Domain setzen (13)

Tipp von Frank zum Thema RedHat, CentOS, Fedora ...