SAP HANA - Schéma dans l'entrepôt de données

Les schémas sont une description logique des tables dans Data Warehouse. Les schémas sont créés en joignant plusieurs tables de faits et de dimensions pour répondre à une logique métier.

La base de données utilise un modèle relationnel pour stocker les données. Cependant, Data Warehouse utilise des schémas qui joignent des dimensions et des tables de faits pour répondre à la logique métier. Il existe trois types de schémas utilisés dans un entrepôt de données -

  • Schéma en étoile
  • Schéma de flocons de neige
  • Schéma de la galaxie

Schéma en étoile

Dans le schéma en étoile, chaque dimension est jointe à une seule table de faits. Chaque dimension est représentée par une seule dimension et n'est pas normalisée davantage.

La table de dimension contient un ensemble d'attributs utilisés pour analyser les données.

Example - Dans l'exemple donné ci-dessous, nous avons une table de faits FactSales qui a des clés primaires pour toutes les tables Dim et mesure les unités_vendues et dollars_ vendues pour faire l'analyse.

Nous avons quatre tables de dimension - DimTime, DimItem, DimBranch, DimLocation

Chaque table de dimension est connectée à la table de faits car la table de faits a une clé primaire pour chaque table de dimension utilisée pour joindre deux tables.

Les faits / mesures dans la table de faits sont utilisés à des fins d'analyse avec l'attribut dans les tables de dimension.

Schéma de flocons de neige

Dans le schéma Snowflakes, certaines tables de dimension sont en outre, les tables normalisées et Dim sont connectées à une seule table de faits. La normalisation est utilisée pour organiser les attributs et les tables de la base de données afin de minimiser la redondance des données.

La normalisation consiste à diviser une table en tables plus petites moins redondantes sans perdre aucune information et les tables plus petites sont jointes à la table Dimension.

Dans l'exemple ci-dessus, les tables DimItem et DimLocation Dimension sont normalisées sans perdre aucune information. C'est ce qu'on appelle le schéma Snowflakes où les tables de dimension sont davantage normalisées en tables plus petites.

Schéma de la galaxie

Dans Galaxy Schema, il existe plusieurs tables de faits et tables de dimensions. Chaque table de faits stocke les clés primaires de quelques tables de dimension et des mesures / faits à analyser.

Dans l'exemple ci-dessus, il existe deux tables de faits FactSales, FactShipping et plusieurs tables de dimension jointes à des tables de faits. Chaque table de faits contient la clé primaire pour les tables Dim jointes et les mesures / faits pour effectuer l'analyse.