Data Warehouse

Ein Data Warehouse ist ein zentrales Datenlager, welches zu Analysezwecken genutzt wird und die Auswertung von Daten vereinfacht. Dies verhilft Unternehmen langfristig zu einer verbesserten Entscheidungsfindung in der Kundenkommunikation, Projektsteuerung und vielen weiteren Prozessen.

In diesem Artikel teilen wir unsere Erkenntnisse aus der Durchführung zahlreicher erfolgreicher Data Warehouse-Migrationen bei unserem Beratungsunternehmen Datasolut und führen Sie durch das wichtigsten Aspekte und technischen Details und Erfahrungen, die wir im Laufe der Jahre in der Zusammenarbeit mit Start-ups und großen Unternehmen gesammelt haben.

  1. Was ist ein Data Warehouse
  2. Wie funktioniert ein Data Warehouse?
  3. Was sind die Vorteile eines Data Warehouse?
  4. In welchen Bereichen lässt sich ein Data Warehouse implementieren?
  5. Was sind die Herausforderungen im Umgang mit einem Data Warehouse?  
  6. Fazit
  7. FAQ

Das Wichtigste auf einen Blick  

  • Ein Data Warehouse (DWH) beschreibt ein zentralisiertes Datenbanksystem, welches dem Unternehmen zu verschiedenen Analysezwecken dient 
  • Zu den wesentlichen Funktionen eines DWH gehören die Extraktion, Sammlung sowie Sicherung von Daten 
  • Durch die Anwendung eines DWH verringert sich die Komplexität bestehender Datenquellen stark und die Datenqualität verbessert sich 
  • In unterschiedlichen Bereichen wie der Finanzdienstleistung, Bauwesen oder dem Einzelhandel lässt sich ein DWH mit Erfolg einsetzen 
  • Die Data Warehouse-Datenbasis, ETL, das Archivierungssystem und Meta-Datenbanksystem stellen Hauptbestandteile eines Data Warehouse dar  

Was ist ein Data Warehouse? 

Das Data Warehouse (kurz: DWH) ist ein zentralisiertes Datenbanksystem, mit dessen Hilfe ein Unternehmen verschiedene Analysezwecke umsetzen kann. Die ersten Erwähnungen des Konzepts gehen auf die späten 1980er Jahre zurück, als die IBM-Forscher Barry Devlin und Paul Murphy das „Business Data Warehouse“ entwickelten. Zu den grundlegenden Funktionen eines DWH gehören die Extraktion, Sammlung sowie Sicherung unternehmensrelevanter Daten. Vor allem dann, wenn in einem Unternehmen viele komplexe Daten aufeinandertreffen, macht ein DWH Sinn. 

Der Großteil der in einem DWH gesammelten Daten besteht aus Daten unterschiedlicher Quellen: z.B. interne Abteilungen (Marketing & Vertrieb), Apps oder Daten weiterer genutzter Anwendungen. Diese müssen zunächst in eine einheitliche Form umgeschrieben werden – anders als beim Data Lake.

Wie genau die Speicherung von Daten im Data Warehouse abläuft, erfahren Sie im nächsten Absatz.

Komponenten einer Data Warehouse Architektur

Ein DWH setzt sich im Allgemeinen aus verschiedenen Merkmalen wie dem Sammeln oder Abrufen von Daten zusammen. Da ein DWH als zentrale Stelle die Speicherung von Daten bewerkstelligt, muss diese hohen technischen Anforderungen genügen.  

Daher ist die Mehrheit der DWH in Schichten organisiert, wie man es von einem sogenannten OSI-Schichtenmodell kennt. Dabei werden je nach Schicht unterschiedliche Funktionen wie die Sammlung, Sortierung, Speicherung oder Segmentierung veranlasst. 

Die Funktionsweise eines Data Warehouses lässt sich durch vier Schritte im „Data Warehousing“ erklären:

  1. Datenbeschaffung: Dieser Teilbereich setzt sich mit der reinen Beschaffung der Daten auseinander. Dabei können die benötigten Daten aus unterschiedlichen Quellen bezogen werden.  
     
  2. Datenspeicherung: Nachdem genügend Daten erhoben wurden, lassen sich diese in diesem Teilbereich zur langfristigen Sicherung speichern.  
     
  3. Datenauswertung: Dieser Schritt befasst sich hauptsächlich mit der Auswertung zuvor erhobener Daten. Dabei geht es darum, die Daten so auszuwerten, dass qualitativ hochwertige Daten erhalten bleiben. 
     
  4. Datenversorgung: Erhobene sowie gespeicherte Daten haben den Zweck, möglichen Anwendungen jederzeit im Unternehmen zur Verfügung zu stehen.
Ablauf der Datenspeicherung im Data Warehouse: strukturierte Daten, ETL, Data Warehouses und BI/Reports.
Ablauf Datenspeicherung im Data Warehouse.

Dabei setzt sich die Data Warehouse Architektur aus den folgenden vier Komponenten zusammen: Die…

  1. …Quellsysteme
  2. …Data Staging Area
  3. …Data Presentation Area
  4. …Data Access Tools

In der folgenden Tabelle sind die Architektur-Komponenten und ihre jeweilige Funktion abgebildet.

Architektur-BereichFunktion
Quellsysteme (DWH-Datenbasis)Stellen Daten für Datenlager bereit
Data Staging Area (ETL)Extrahiert, strukturiert, transformiert und lädt Daten aus unterschiedlichen Systemen: ETL-Prozess
Data Presentation Area (Archivierungssystem)Parallele Speicherplattform, die separaten Datenzugriff für Anwendungen und nachgelagerte Systeme ermöglicht
Data Access Tools (Meta-Datenbanksystem)Ermöglicht Datenzugriff (durch die so genannten Data Marts)
Die einzelnen Architektur-Bereiche eines Data Warehouse und deren Funktion.

Was sind die Vorteile eines Data Warehouse? 

Ein Data Warehouse bietet zahlreiche Vorteile. Zu diesen gehören unter anderem:  

  • Hochwertige Daten: Um einen stetigen Zugriff auf hochqualitative und unternehmensrelevante Daten zu haben, lassen sich Daten in einem DWH sichern. Somit sind potenzielle Daten zum einen zugänglicher und zum anderen in seinem Bestand konsistent. Langfristig erhöht sich somit die Qualität des Datenbestands.  
  • Verbesserte Entscheidungsfindung: Aufgrund der langfristigen Verbesserung des Datenbestands lassen sich Entscheidungen effizienter und schneller treffen. Dies liegt vor allem daran, dass sich die Daten innerhalb eines DWH vollständig und von hoher Qualität sind.  
  • Auswertung: Aufgrund der Integration unterschiedlicher Datenbestände aus verschiedenen Quellen lässt sich eine übergreifende Auswertung des gesamten Datenbestands ermöglichen.  
  • Datenverfügbarkeit: Zudem ist eine flexible und schnelle Verfügbarkeit von Kennzahlen, Statistiken oder Berichten jederzeit gestattet. 
  • Erhöhter ROI: Mithilfe der Nutzung eines DWH lässt sich der Return on Invest in einer Vielzahl ein Fällen erheblich steigern. Dies liegt vor allem daran, dass durch die Strukturierung und Speicherung großer Datenmengen, eine verbesserte Übersicht und somit eine Erbringung neuer Erkenntnisse zur Verbesserung des Unternehmenserfolg möglich ist.  
  • Zeitersparnis: Mithilfe eines Data Warehouse lassen sich benötigte Daten in wenigen Augenblicken abrufen. Dies spielt vor allem in der heutigen schnelllebigen unternehmerischen Praxis eine entscheidende Rolle. 

In welchen Bereichen lässt sich ein Data Warehouse implementieren? 

Die strukturierte Datenbereitstellung bringt in zahlreichen Branchen und Anwendungen einige Vorteile mit sich. Im Folgenden werden Ihnen unterschiedliche Funktionen und Vorteile anhand verschiedener Branchen erklärt: 

Beispiel 1:

  • Finanzdienstleistung: Gerade in Bereichen, in denen sich der Arbeitsalltag primär um die Analyse von Zahlen dreht, spielt die jederzeitige Nutzung relevanter Daten eine entscheidende Rolle. Daher benötigen vor allem Versicherungsunternehmen sowie Banken einen stetigen Zugang zu wertvollen Informationen. Die benötigten Informationen und Daten sind jedoch nur dann wertvoll, wenn diese ordnungsgemäß validiert und untereinander verknüpft sind. Ein DWH bietet genau diese Möglichkeit. 

Beispiel 2:

  • Gesundheitswesen: Um zu verschiedenen Patienten wichtig Informationen zu erhalten, wird ein Data Warehouse ebenfalls im Gesundheitswesen angewendet. Jegliche personenbezogenen Daten wie Krankheitsbilder und weitere Gesundheitsdaten sowie finanzielle Transaktionen und Versicherungsdaten können somit innerhalb einer Datenbank zur guten Übersichtlichkeit genutzt werden.  

Beispiel 3:

  • Einzelhandel: Ebenfalls stellen die schnelle Bereitstellung sowie Archivierung wichtiger Daten im Einzelhandel eine wichtige Rolle. Vor allem dann, wenn eine große Anzahl an Kunden besteht, ist eine Strukturierung vorliegender Daten unumgänglich. Dabei können sowohl individuelle Kundeninformationen als auch Verkaufszahlen oder weitere Kennzahlen ermittelt sowie gespeichert werden.  

Was sind die Herausforderungen im Umgang mit einem Data Warehouse?  

Trotz zahlreicher Vorteile eines Data Warehouse bietet dieses auch gewissen Herausforderungen, die es zu beachten gilt. Im Nachfolgenden betrachten wir die Herausforderungen eines DWH in einer Tabelle: 

HerausforderungBegründung
ReportingUnterschiedliche Abteilungen eines Unternehmens müssen mit einbezogen werden. Deshalb hat ein DWH einen gewissen Zeitaufwand im Rahmen des Reportings.
KostenDas Verhältnis zwischen Kosten und Nutzen: Je nach Unternehmensgröße und Datenbestand kann es vorkommen, dass das Verhältnis zwischen den entstehenden Kosten und dem generierten Wert in einem nicht rentablen Verhältnis steht.  
FlexibilitätVereinfachung der Daten: Dies erschwert daraufhin meist die Arbeit innerhalb der Praxis, da gewisse Strukturen und Verbindungen der Daten schlechter ersichtlich sind.  
DatenschutzLediglich vertrauenswürdige und dem Unternehmen zugehörige Personen sollten einen Zugriff auf das Data Warehouse haben.  
Die Herausforderungen eines Data Warehouse mit entsprechender Begründung.

Was ist der Unterschied zwischen einem Data Warehouse und einem Data Lake?

Häufig wird ein Data Warehouse heute auch als Bestandteil eines Data Lake Konzeptes gesehen. Dass dies nicht der Fall ist, soll besonders folgende Tabelle zeigen. Hier haben wir die wichtigsten Unterschiede zwischen einem DWH und einem Data Lake aufgelistet:

ItemData WarehouseData Lake
DatenstrukturStrukturiert (verarbeitet)Strukturiert, semi-strukturiert, unstrukturiert (Roh)
Verwendungszweck der DatenBereits festgelegtNoch unbekannt
BenutzerBusiness-Anwender, KPI-ReportingData Scientist
Flexibilität für neue DatenquellenGeringHoch
Pflegeeinfachhoch
Größe der DatenMittelGroß
SkalierbarkeitGeringHoch
Data Warehouse vs. Data Lake.

Mit einem Data Engineering Team lassen sich sowohl Data Warehouse als auch Data Lake optimal erstellen und warten. In unserer Data Engineering Beratung erfahren Sie, wie das geht!

Fazit 

Prinzipiell bietet ein DWH jedem Unternehmen einen Mehrwert, welches ein solches System als Grundlage zur besseren Entscheidungsfindung nutzen möchte. Da ein Data Warehouse als eine Art autonome Datenbank gilt, welche Daten aus verschiedeneren Quellen zusammenführt, verringert sich die Komplexität um ein Vielfaches. Vor allem für Datenanalysen sowie betriebliche Entscheidungsprozesse ist dies sehr hilfreich und viele Unternehmen sollten dies beachten.  

Sie interessieren sich für das Thema und möchten gerne mehr erfahren? Dann kontaktieren Sie uns doch gerne!

FAQ

Was ist ein Data Warehouse?

Ein Data Warehouse ist ein zentraler Datenspeicher, welcher in den Bereich Business-Intelligence fällt. Die Daten werden in strukturierter Form extrahiert, gesammelt und gesichert. Durch ein Meta-Datenbanksystem mit sogenannten Access-Tools, gelingt ein unproblematischer Zugriff auf aktuell relevante Daten. 

Welche Vorteile bietet ein Data Warehouse?

Durch die zentrale Speicherung von Unternehmensrelevanten Daten gelingt ein fortwährender Zugriff auf diese. Indem der Datenbestand stetig erneuert und gewartet wird, gelingt eine präzise Analyse mit Analysetools wie zum Beispiel Machine Learning. Dadurch lassen sich gewisse Entscheidungsprozesse im Unternehmen optimieren und durch datengestützte Handlungsempfehlungen vereinfachen.

Wie sieht die DWH Architektur aus?

Die Architektur setzt sich allgemein aus vier verschiedenen Komponenten zusammen: Die DWH-Datenbasis, ETL, das Archivierungssystem und das Meta-Banksystem. 

Ihr Ansprechpartner: Vinzent Wuttke

Unternehmen sitzen auf einem ungenutzten Berg von Kundendaten. Wir von datasolut entwickeln künstliche Intelligenz, die Ihr Marketing optimiert. Damit Sie dem richtigen Kunden zur richtigen Zeit das richtige Angebot machen können.