SAP HANA - Modélisateur d'informations

Modeleur d'informations SAP HANA; également connu sous le nom de HANA Data Modeler, il est au cœur du système HANA. Il permet de créer des vues de modélisation en haut des tables de base de données et d'implémenter une logique métier pour créer un rapport significatif pour l'analyse.

Caractéristiques d'Information Modeler

  • Fournit plusieurs vues des données transactionnelles stockées dans les tables physiques de la base de données HANA à des fins d'analyse et de logique métier.

  • Le modeleur informatif ne fonctionne que pour les tables de stockage basées sur des colonnes.

  • Les vues de modélisation des informations sont utilisées par des applications Java ou HTML ou des outils SAP tels que SAP Lumira ou Analysis Office à des fins de reporting.

  • Également possible d'utiliser des outils tiers comme MS Excel pour se connecter à HANA et créer des rapports.

  • Les vues de modélisation SAP HANA exploitent la puissance réelle de SAP HANA.

Il existe trois types de vues d'informations, définies comme suit:

  • Vue d'attribut
  • Vue analytique
  • Vue de calcul

Magasin de lignes ou de colonnes

Les vues du modélisateur SAP HANA ne peuvent être créées qu'en haut des tables basées sur des colonnes. Le stockage des données dans des tables de colonnes n'est pas une nouveauté. Auparavant, il était supposé que le stockage des données dans une structure basée sur des colonnes prenait plus de mémoire et non des performances optimisées.

Avec l'évolution de SAP HANA, HANA a utilisé le stockage de données basé sur des colonnes dans les vues Information et a présenté les avantages réels des tables en colonnes par rapport aux tables basées sur des lignes.

Magasin de colonnes

Dans une table de stockage de colonnes, les données sont stockées verticalement. Ainsi, des types de données similaires sont réunis, comme indiqué dans l'exemple ci-dessus. Il fournit des opérations de lecture et d'écriture de mémoire plus rapides avec l'aide du moteur de calcul en mémoire.

Dans une base de données conventionnelle, les données sont stockées dans une structure basée sur des lignes, c'est-à-dire horizontalement. SAP HANA stocke les données dans une structure basée sur les lignes et les colonnes. Cela offre une optimisation des performances, une flexibilité et une compression des données dans la base de données HANA.

Le stockage des données dans une table basée sur des colonnes présente les avantages suivants:

  • Compression de données

  • Accès en lecture et en écriture plus rapide aux tables par rapport au stockage classique basé sur les lignes

  • Flexibilité et traitement parallèle

  • Effectuer des agrégations et des calculs à une vitesse plus élevée

Il existe diverses méthodes et algorithmes permettant de stocker les données dans une structure basée sur des colonnes - Dictionary Compressed, Run Length Compressed et bien d'autres.

Dans Dictionary Compressed, les cellules sont stockées sous forme de nombres dans des tableaux et les cellules numériques sont toujours optimisées par rapport aux caractères.

Dans Run length compressé, il enregistre le multiplicateur avec la valeur de la cellule au format numérique et le multiplicateur affiche la valeur répétitive dans le tableau.

Différence fonctionnelle - Magasin de lignes et de colonnes

Il est toujours conseillé d'utiliser le stockage basé sur des colonnes, si l'instruction SQL doit effectuer des fonctions d'agrégation et des calculs. Les tables basées sur des colonnes fonctionnent toujours mieux lors de l'exécution de fonctions d'agrégation telles que Sum, Count, Max, Min.

Le stockage basé sur les lignes est préférable lorsque la sortie doit renvoyer une ligne complète. L'exemple donné ci-dessous le rend facile à comprendre.

Dans l'exemple ci-dessus, lors de l'exécution d'une fonction d'agrégation (Sum) dans la colonne des ventes avec la clause Where, elle utilisera uniquement la colonne Date et Sales lors de l'exécution de la requête SQL, donc s'il s'agit d'une table de stockage basée sur une colonne, les performances seront optimisées, plus rapidement que les données n'est requis qu'à partir de deux colonnes.

Lors de l'exécution d'une simple requête de sélection, la ligne complète doit être imprimée dans la sortie, il est donc conseillé de stocker la table en tant que ligne basée dans ce scénario.

Vues de modélisation d'informations

Vue d'attribut

Les attributs sont des éléments non mesurables dans une table de base de données. Ils représentent des données de base et similaires aux caractéristiques de BW. Les vues d'attribut sont des dimensions dans une base de données ou sont utilisées pour joindre des dimensions ou d'autres vues d'attributs dans la modélisation.

Les caractéristiques importantes sont -

  • Les vues d'attributs sont utilisées dans les vues d'analyse et de calcul.
  • La vue d'attribut représente les données de base.
  • Utilisé pour filtrer la taille des tables de dimension dans la vue analytique et de calcul.

Vue analytique

Les vues analytiques utilisent la puissance de SAP HANA pour effectuer des calculs et des fonctions d'agrégation sur les tables de la base de données. Il a au moins une table de faits qui contient des mesures et des clés primaires de tables de dimension et entourée de tables de dimension contenant des données de base.

Les caractéristiques importantes sont -

  • Les vues analytiques sont conçues pour exécuter des requêtes de schéma en étoile.

  • Les vues analytiques contiennent au moins une table de faits et plusieurs tables de dimension avec des données de base et effectuent des calculs et des agrégations

  • Ils sont similaires aux Info Cubes et aux objets Info dans SAP BW.

  • Des vues analytiques peuvent être créées au-dessus des vues d'attributs et des tables de faits et effectuer des calculs tels que le nombre d'unités vendues, le prix total, etc.

Vues de calcul

Les vues de calcul sont utilisées en plus des vues analytiques et d'attributs pour effectuer des calculs complexes, ce qui n'est pas possible avec les vues analytiques. La vue de calcul est une combinaison de tables de colonnes de base, de vues d'attributs et de vues analytiques pour fournir une logique métier.

Les caractéristiques importantes sont -

  • Les vues de calcul sont définies graphiquement à l'aide de la fonction de modélisation HANA ou scriptées dans le SQL.

  • Il est créé pour effectuer des calculs complexes, ce qui n'est pas possible avec d'autres vues - Vues attributaires et analytiques du modeleur SAP HANA.

  • Une ou plusieurs vues d'attributs et vues analytiques sont utilisées à l'aide de fonctions intégrées telles que projets, union, jointure, classement dans une vue de calcul.