heinzwiedermann
Goto Top

Felder mit Werten aus Dubletten füllen

Guten Morgen zusammen,

ich möchte (d.h. ich muss) überprüfen, ob in einer Dublette eines Datensatzes evtl. in einem der Felder ein Wert vorhanden ist, der in meinem Original nicht vorhanden ist. Konkretes Beispiel:

Lisa Müller hat im Original eine Festnetznummer, aber keine Mobilfunknummer, in einer der 5 Dubletten in der Datenbank ist es umgekehrt; Mobilfunknummer, aber keine Festnetznummer.

Ich habe ca. 1,5 Millionen Datensätze mit ca. 2,5 Millionen Dubletten, jeweils mit unterschiedlichen Werten in einigen Feldern. Wie verdichte ich diese Informationen jetzt auf einen Datensatz?

Dank im Voraus

Content-Key: 54112

Url: https://administrator.de/contentid/54112

Ausgedruckt am: 29.03.2024 um 08:03 Uhr

Mitglied: Biber
Biber 15.03.2007 um 14:17:09 Uhr
Goto Top
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei uns im Norden das Wort Dubletten irgendwie eine geringfügig andere Bedeutung zu haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original- und "Dubletten"-Lisa-Müller-Sätze? Vorname und Name? Kundennummer?
- Wenn in einem FeldX in dem "Dubletten"-Satz ein wert steht und im Original kein Wert, dann ist automatisch der "Dubletten"-Satz richtig(er)?
-wenn dazu mehrere Dubletten existieren, dann hat zweite Dublette mehr Wahrheit in sich als die erste, aber weniger als die als drittes gelesene????

Kannst Du mal so ein bis anderthalb Zeilen zum Hintergrund dieser Daten-"Abgleichs"-Mimik erzählen?

Danke
Biber
Mitglied: HeinzWiedermann
HeinzWiedermann 15.03.2007 um 14:44:30 Uhr
Goto Top
Moin HeinzWiedermann,

da muss ich mal rückfragen, weil bei
uns im Norden das Wort Dubletten irgendwie
eine geringfügig andere Bedeutung zu
haben scheint...

Bei Deinem Lisa-Müller-Beispiel:
- was ist denn das gemeinsame der Original-
und
"Dubletten"-Lisa-Müller-Sätze?
Vorname und Name? Kundennummer?

Die Gemeinsamkeit definiert sich über Name, Straße, Hnr, PLZ.

- Wenn in einem FeldX in dem
"Dubletten"-Satz ein wert steht und
im Original kein Wert, dann ist automatisch
der "Dubletten"-Satz richtig(er)?

Sogesehen schon. Die Daten sind in alle in Ordnung und in dem für mich richtigen Format bzw standardisiert. Mir ist es wichtig, die Informationen in einem Datensatz zu bündeln.

-wenn dazu mehrere Dubletten existieren,
dann hat zweite Dublette mehr Wahrheit in
sich als die erste, aber weniger als die als
drittes gelesene????

Darüber habe ich mir auch schon Gedanken gemacht. Grundsätzlich hätte ich aber erstmal einen Lösungsansatz. Gehen wir also davon aus, dass es keine 'richtigeren' werte gibt, sondern nur 0 und 1 und ich nur jeweils den ersten gefundenen Wert brauche. Sollte ein Wert ebenfalls in einer anderen Dublette stehen, so wird dieser ignoriert. face-smile


Kannst Du mal so ein bis anderthalb Zeilen
zum Hintergrund dieser
Daten-"Abgleichs"-Mimik
erzählen?

Danke
Biber
Mitglied: Biber
Biber 15.03.2007 um 21:35:44 Uhr
Goto Top
Hmmm,
dann ist es jetzt eine Frage der Strategie bzw. der Risikobereitschaft.

Angenommen, es gäbe noch 20 weitere Felder außer den Schlüsselfeldern, dann
- (für Vewegene) könnte eine Mimik sein, den "Original"-Satz in ALLEN Feldern zu aktualisieren, wenn in Original-Feld1 nichts und in Dubletten-Feld1 etwas steht ODER in O-Feld2 nichts und in D-Feld2 etwas ODER...usw usw.
Dabei wäre es aber fast unausweichlich, dass auch mal gefüllte Felder in der O-Datei übernagelt werden mit leeren Feldinhalten der D-Datei
-(für Ängstlichere) das feldweise Vorgehen: Wenn Schlüsselfelder gleich und in D-Feld1 steht etwas und in O-Feld1 nichts, dann dieses eine Feld updaten in der O-Datei.

Irgendwelche Vorlieben?

Gruss
Biber