philippe-m
Goto Top

Leichte Erklärung Data Warehouse

Hallo zusammen,

ich möchte gerne wissen, was Data-Warehouse genau ist. Ich brauche eine einfache Erklärung (für DAU´s).

Liege ich richtig in der Annahme, dass es wie beim Lotus-Notes mehrere Datenbanken sind? Man kann dann mit Abfragen auf irgendeine der Datenbanken zugreigen?

Vielen Dank im voraus

Content-Key: 125332

Url: https://administrator.de/contentid/125332

Printed on: April 26, 2024 at 05:04 o'clock

Mitglied: 81825
81825 Sep 19, 2009 at 11:16:41 (UTC)
Goto Top
http://tinyurl.com/nf57ys
1 x "nicht anspruchsvoll"
Member: Philippe-M
Philippe-M Sep 19, 2009 at 11:22:33 (UTC)
Goto Top
Danke für deine Kompetente Antwort
Member: aqui
aqui Sep 19, 2009 at 11:39:49 (UTC)
Goto Top
Hier ist auch noch eine Erklärung für Dummies:

http://de.wikipedia.org/wiki/Data-Warehouse

P.S.: 3 Sekunden mit Dr. Google !!
Member: Philippe-M
Philippe-M Sep 19, 2009 at 11:48:29 (UTC)
Goto Top
Die Sache ist die.... Wenn ich eine Info möchte, geh ich auch auf die Wiki page. Wenn ich eine ganz einfache Erklärung will reicht das nicht. Ich hab mir schon eine Zusammenfassung geschrieben!!! Leider bräuchte ich eine Erklärung, wie man sich das in der Praxis vorstellen kann. Da hat man z.B. ein SAP-Server und Lotus Notes. Beide haben eine oder mehere Datenbanken. Durch das Datawarehouse werden diese in eine Zieldatenbak vereint. Somit kann man eine Abfrage über alle Datenbanken strarten.

ISt das so richtig?
Member: aqui
aqui Sep 19, 2009 at 12:07:22 (UTC)
Goto Top
...oder man hat einen Linux Server mit einer MySQL Datenbank der mehrere andere Datenbanken anzapft und Daten sichert und die dann weiterverarbeitet...

Fazit: Ja, das ist so richtig !
Member: manuel-r
manuel-r Sep 19, 2009 at 12:42:51 (UTC)
Goto Top
Data-Warehouse meint ganz einfach, dass man alle zur Verfügung stehenden Quellen anzapfen kann und deren Daten miteinander zu verknüpfen. In einem Unternehmen können das bspw. das ERP, die WaWi, verschiedenstes Excel-Sheets oder Access-DBs, die Zeiterfassung, das Onlinebanking oder was auch immer sein.
Welche Daten ich anzapfe hängt maßgeblich davon, ab welche "Frage" ich dem System stelle.
Der Grundgedanke bei den Systemen ist eigentlich der, dass ein sehr großer Prozentsatz aller interessanten Informationen im Unternehmen digital und auswertbar vorliegen. Was ist also leichter als einen Rechner damit zu beauftragen die Daten zu sammeln, auszuwerten und nach verschiedenen Gesichtspunkten aufzubereiten.
Im Prinzip nichts neues. Nur hat man dazu früher ganze Abteilungen damit beschäftigen müssen. Oder man musste sich als GL die Daten aus der jeweiligen Abteilung kommen lassen. Das birgt bzw. barg natürlich immer die Gefahr, dass alles unschöne erst mal entfernt wurde face-wink

Manuel
Member: Biber
Biber Sep 19, 2009 at 12:59:28 (UTC)
Goto Top
@aqui

Nein, das ist so nicht richtig bzw. keine Abgrenzung.

Nicht alles, was erst grün und dann rot ist, ist ein Frosch in der Moulinette.

@philippe_m
Das funktioniert so nicht.
Du kannst nicht mit Suggestivfragen und Aufforderungen wie "Beschreibt mir mal ein Konzept wie Datawarehousing mit 5 Worten oder zumindest einfacher als Wikipedia" um die Ecke kommen und erhellende Antworten erwarten.
Dann kommt dann etwas raus, bei dem ich sicher bin, dass Du hinterher definitiv nicht verstanden hast, worum es geht.

Ich versuch mal, wenigstens ein paar der Doppeldeutigkeiten zu klären.
Zitat von @Philippe-M:
Da hat man z.B. ein SAP-Server und Lotus Notes. Beide haben eine oder mehere Datenbanken. Durch das Datawarehouse werden diese in eine Zieldatenbak vereint. Somit kann man eine Abfrage über alle Datenbanken strarten.

Ja nee.... teils, teils.
Richtig ist:
  • Informationen/Unternehmensdaten entstehen und werden verwaltet in "Operativsystemen". Z.B. SAP, Lohnabrechnung, Produktionssteuerung, meinetwegen auch Office-Anwendungen - Systemen, die den normalen Geschäftsprozess unterstützen und prozessbezogen sind. und irgendeine schmale Nische des Gesamtunternehmens abdecken. Als Abfallprodukt bei dieser Prozessunterstützung werden zwangsläufig Daten gesammelt bezogen auf die Vergangenheit (Stückzahlen am letzten Dienstag, Kosten im Mai, Gesamtumsatz erstes Quartal...).

  • Diese "Vergangenheitsdaten" werden als inhaltliche, aber nicht als 1:1-Kopie vom Operativsystem bereitgestell in einem sogenannten ETL-Prozess, aber eben selektiv (viele Daten braucht nur das Operativsystem zum Arbeiten, aber es sind kein "Informationen", die irgendwo sinnvoll veredelt/zu Kennzahlen verdichtet werden könnten).

  • diese unterschiedlich strukturierten Daten aus heterogenen Quellsystemen werden geprüft, harmonisiert, vereinheitlicht und landen nach Passieren diverser Layer (Application Layer, Input Layer, Storage Layer, Output Layer, Presentation Layer) und ebensovielen Quality Gates in Datamarts als miteinander verknüpfbare Informationen für Berichts/Reportingsysteme.
Erst danach in diesen DataMart/Outputlayer und folgende-Phasen geht es los mit dem, was ein DWH ausmacht.

Der erste Schritt - das reine Kopieren von Daten aus Operativsystemen ist wirklich nur der Anfang - denn dann sind die Daten weder geprüft noch harmonisiert noch miteinander kombinierbar.
Geschweige denn "gleichzeitig abfragbar."

Wie Du hoffentlich merkst: ein DWH ist ebenso wie die Herstellung einer Bastmatte oder das Leben des Brian nicht "in zwei Sätzen für DAUs" beschreibbar.

Grüße
Biber