Skip to main content

Data Vault Schichten

Die Datenlandschaft eines Unternehmens mit mehreren Quellen ist komplex und umfangreich. Über mehrere Schichten wird aus den verfügbaren Daten wertvolle Information und Wissen erzeugt:

Data Vault SchichtenDie Stage enthält einen Abzug der Quelldaten.

Die Integration im Data Vault erfolgt über zwei Schichten: 

Der Raw Vault integriert die Rohdaten der Quellsysteme über gemeinsame Geschäftsschlüssel in den Hubs und verknüpft diese mit Links. Der beschreibende Geschäftskontext wird über quellsystemspezifische Satelliten historisiert. Alle verfügbaren Attribute der Quellsysteme werden so einem Geschäftsobjekt zugeordnet. Dadurch eignet sich Data Vault auch sehr gut für analytisches Master Data Management.

Der Business Vault konsolidiert die Quellsystemattribute in ein Fachbereichsmodell und implementiert die Geschäftsregeln des Fachbereichs. Geschäftsregeln ändern sich schnell. Durch die strikte Trennung der Rohdaten im Raw Vault von den Geschäftsregeln im Business Vault können diese Änderungen schnell umgesetzt werden.

Die Data Mart stellt das Fachbereichsmodell im Business Vault als leicht abfragbares Star Schema bzw. als Cube zur Verfügung.

Business Intelligence (BI) bezeichnet die Analysetools und Dashboards, die zur Auswertung und Anzeige der Informationen eingesetzt werden.

Data Vault ist technologieunabhängig. Die Methode funktioniert mit relationalen und Big Data Technologien. Oft wird eine persistierte Stage bzw. ein Data Lake als Basis eingesetzt.  

Das Featureset für Machine Learning und KI Algorithmen kann sowohl aus Rohdaten als auch aus Businessdaten erzeugt werden. Die Ergebnisse werden einfach als Satellit wieder zurückgeschrieben. Bei Streaming Anwendungen wird direkt in den Raw Vault geschrieben.