Data Warehouse im Big-Data- und Data-Lake-Umfeld


Data Warehouse als Basis für Big Data und neue Technologien

Big-Data-Experten, Software-Entwickler und Fachabteilungen suchen nach der alles umfassenden IT-Plattform: Sie soll strukturierte sowie unstrukturierte Informationen sofort liefern, nach Relevanz analysieren, kosteneffizient, benutzerfreundlich sowie flexibel über die Cloud erreichbar sein sowie alles jahrelang speichern. Das klingt nach Utopie, der wir aber durch neue Echtzeit-Technologien immer näher rücken. Doch würde damit auch ein auf historische Daten spezialisiertes Data Warehouse überflüssig werden?

Im Zuge von Digitalisierung und Internet of Things schreitet die Integration von Data-Warehouse- und Big-Data-Technologien weiter voran. Echtzeitfähige transaktionale Systeme und Data Warehouse (DWH) erfüllen jedoch völlig unterschiedliche Aufgaben, weshalb eine Ablösung des DWHs aus heutiger Sicht utopisch erscheint. Wenn beispielsweise Muster analysiert und bewertet werden sollen, müssen Vergleichsgrößen vorliegen – und diese stammen aus der Vergangenheit, also aus dem Data Warehouse. Transaktionale Echtzeitlösungen oder operative Systeme halten dagegen kaum historische Daten vor.
Eine *Umfrage unter Daten-Experten bestätigt die Bedeutung des Data Warehouse: 99 Prozent halten Data Warehousing für wichtig bis sehr wichtig für ihre Geschäftsprozesse. Aktuell wird im Big-Data- und Data-Lake-Umfeld daran gearbeitet, wie sich qualitative Informationen vor allem aus neuen Quellen besser an das DWH ankoppeln lassen. Data Scientists sollen dann aus den unstrukturierten Daten, die im Data Lake gesammelt werden, wertvolle Erkenntnisse gewinnen.

*Dimensional Research: "The State of the Data Warehouse", 2015

Big Data vs. Data Warehouse: Die richtigen Fragen stellen

Doch umso unstrukturierter die Daten sind, desto schwerer ist es, vernünftige Fragen oder gar Ziele aus den Daten herauszufiltern. Bei Data-Warehouse-Projekten liegen meist alle Kennzahlen und Resultate für Auswertungen vor. In Big-Data-Projekten fehlt diese klare Zielvorgabe. Daten-Experten der mip GmbH beobachten momentan, dass Unternehmen meist mit den neuen Technologien und Data Lakes experimentieren. Für eine zielgerichtete Annäherung an die enormen Informationsmengen benötigt es jedoch zum einen Spezialisten aus den Fachbereichen und zum anderen Data Scientists, die sich mit den neuen Technologien auskennen.

Historische Daten und Data Warehouse weiterhin gefragt

Anwendungsgebiete für DWHs finden sich zahlreich. Unternehmen bedürfen aufgrund steuerrechtlicher Vorgaben immer einer langfristigen Daten-Dokumentation. Unterschiedliche Anforderungen in den Industriezweigen schaffen weitere Einsatzszenarien. Im Handel zum Beispiel verändert sich das Kaufverhalten der Verbraucher sehr rasch. Predictive Analytics und Voraussagen setzen aber stets den Vergleich mit vorliegenden Datenprofilen voraus, um Muster oder Trends erkennen zu können. Auch die Produktion greift auf feststehende Kriterien bzw. historische Daten für die Qualität von Produkten oder Prozessen zurück, um sie validieren zu können.

Die Empfehlung an Unternehmen lautet deshalb:
· ein solides Data Warehouse aufbauen
· Daten zielgerichtet säubern und aufbereiten
· Basis für neue Technologien und Tools schaffen

Was für ein Datentyp sind Sie? Mehr dazu sehen Sie in der Infografik. Melden Sie sich über das Kontaktformular an und erhalten Sie den kostenfreien Download.

Kontaktformular zum Download der Infografik "Welcher Datentyp sind Sie?"

Wir empfehlen

Die führenden Lösungen und Technologien der IBM für Data Warehousing. Damit schaffen Sie ideale Voraussetzungen für die Integration
Ihres Data Warehouses und den Big Data Technologien, damit Sie aus allen Daten wertvolle Erkenntnisse gewinnen können.