Entrepôt de données - Schémas

Un schéma est défini comme une description logique d'une base de données dans laquelle les tables de faits et de dimension sont jointes de manière logique. L'entrepôt de données est maintenu sous la forme de schémas Star, Snowflakes et Fact Constellation.

Schéma en étoile

Un schéma en étoile contient une table de faits et plusieurs tables de dimension. Chaque dimension est représentée avec une seule table à une dimension et elles ne sont pas normalisées. La table Dimension contient un ensemble d'attributs.

Les caractéristiques

  • Dans un schéma en étoile, il n'y a qu'une seule table de faits et plusieurs tables de dimension.
  • Dans un schéma en étoile, chaque dimension est représentée par une table à une dimension.
  • Les tables de dimension ne sont pas normalisées dans un schéma en étoile.
  • Chaque table de dimension est jointe à une clé dans une table de faits.

L'illustration suivante montre les données de vente d'une entreprise par rapport aux quatre dimensions, à savoir le temps, l'article, la succursale et l'emplacement.

Il y a une table de faits au centre. Il contient les clés de chacune des quatre dimensions. La table de faits contient également les attributs, à savoir les dollars vendus et les unités vendues.

Note- Chaque dimension n'a qu'une table à une dimension et chaque table contient un ensemble d'attributs. Par exemple, la table de dimension d'emplacement contient l'ensemble d'attributs {location_key, street, city, province_or_state, country}. Cette contrainte peut entraîner une redondance des données.

For example- «Vancouver» et «Victoria», les deux villes sont situées dans la province canadienne de la Colombie-Britannique. Les entrées pour ces villes peuvent entraîner une redondance des données le long des attributs province_or_state et country.

Schéma de flocons de neige

Certaines tables de dimension du schéma Snowflake sont normalisées. La normalisation divise les données en tables supplémentaires comme indiqué dans l'illustration suivante.

Contrairement au schéma Star, la table de dimension dans un schéma en flocon de neige est normalisée.

For example- La table de dimension article dans un schéma en étoile est normalisée et divisée en deux tables de dimension, à savoir la table article et fournisseur. Désormais, la table des dimensions de l'article contient les attributs clé_article, nom_article, type, marque et clé-fournisseur.

La clé fournisseur est liée à la table de dimension fournisseur. La table de dimension fournisseur contient les attributs clé_fournisseur et type_fournisseur.

Note - En raison de la normalisation dans le schéma Snowflake, la redondance est réduite et par conséquent, il devient facile à maintenir et à économiser de l'espace de stockage.

Schéma de constellation des faits (schéma de la galaxie)

Une constellation de faits a plusieurs tables de faits. Il est également connu sous le nom de schéma Galaxy.

L'illustration suivante montre deux tables de faits, à savoir Ventes et Expédition -

La table de faits sur les ventes est la même que celle du schéma en étoile. La table de faits d'expédition a cinq dimensions, à savoir item_key, time_key, shipper_key, from_location, to_location. Le tableau des données d'expédition contient également deux mesures, à savoir les dollars vendus et les unités vendues. Il est également possible de partager des tables de dimension entre des tables de faits.

For example - Les tables de dimension de temps, d'article et d'emplacement sont partagées entre la table de faits sur les ventes et l'expédition.