Entreposage de données - OLAP

Le serveur de traitement analytique en ligne (OLAP) est basé sur le modèle de données multidimensionnel. Il permet aux gestionnaires et aux analystes d'avoir un aperçu des informations grâce à un accès rapide, cohérent et interactif aux informations. Ce chapitre couvre les types d'OLAP, les opérations sur OLAP, la différence entre OLAP et les bases de données statistiques et OLTP.

Types de serveurs OLAP

Nous avons quatre types de serveurs OLAP -

  • OLAP relationnel (ROLAP)
  • OLAP multidimensionnel (MOLAP)
  • OLAP hybride (HOLAP)
  • Serveurs SQL spécialisés

OLAP relationnel

Les serveurs ROLAP sont placés entre le serveur principal relationnel et les outils frontaux client. Pour stocker et gérer les données de l'entrepôt, ROLAP utilise un SGBD relationnel ou relationnel étendu.

ROLAP comprend les éléments suivants -

  • Implémentation de la logique de navigation d'agrégation.
  • Optimisation pour chaque back-end SGBD.
  • Outils et services supplémentaires.

OLAP multidimensionnel

MOLAP utilise des moteurs de stockage multidimensionnels basés sur des baies pour des vues multidimensionnelles des données. Avec les magasins de données multidimensionnels, l'utilisation du stockage peut être faible si l'ensemble de données est clairsemé. Par conséquent, de nombreux serveurs MOLAP utilisent deux niveaux de représentation de stockage de données pour gérer des ensembles de données denses et rares.

OLAP hybride

L'OLAP hybride est une combinaison de ROLAP et de MOLAP. Il offre une plus grande évolutivité de ROLAP et un calcul plus rapide de MOLAP. Les serveurs HOLAP permettent de stocker les gros volumes de données d'informations détaillées. Les agrégations sont stockées séparément dans le magasin MOLAP.

Serveurs SQL spécialisés

Les serveurs SQL spécialisés fournissent un langage de requête avancé et une prise en charge du traitement des requêtes pour les requêtes SQL sur des schémas en étoile et en flocon dans un environnement en lecture seule.

Opérations OLAP

Les serveurs OLAP étant basés sur une vue multidimensionnelle des données, nous discuterons des opérations OLAP dans les données multidimensionnelles.

Voici la liste des opérations OLAP -

  • Roll-up
  • Drill-down
  • Émincer
  • Pivot (rotation)

Roll-up

Le roll-up effectue une agrégation sur un cube de données de l'une des manières suivantes:

  • En gravissant une hiérarchie de concepts pour une dimension
  • Par réduction de dimension

Le diagramme suivant illustre le fonctionnement du roll-up.

  • La remontée est effectuée en gravissant une hiérarchie de concept pour l'emplacement de dimension.

  • Au départ, la hiérarchie des concepts était "rue <ville <province <pays".

  • Lors du cumul, les données sont agrégées en augmentant la hiérarchie des emplacements du niveau de la ville au niveau du pays.

  • Les données sont regroupées en villes plutôt qu'en pays.

  • Lors de la remontée, une ou plusieurs dimensions du cube de données sont supprimées.

Exploration

Le drill-down est l'opération inverse du roll-up. Il est effectué de l'une des manières suivantes -

  • En supprimant une hiérarchie de concepts pour une dimension
  • En introduisant une nouvelle dimension.

Le diagramme suivant illustre le fonctionnement de l'exploration descendante -

  • L'exploration descendante est effectuée en abaissant une hiérarchie de concept pour le temps de dimension.

  • Au départ, la hiérarchie des concepts était "jour <mois <trimestre <année".

  • Lors de l'exploration vers le bas, la dimension temporelle est descendue du niveau du trimestre au niveau du mois.

  • Lorsque l'exploration est effectuée, une ou plusieurs dimensions du cube de données sont ajoutées.

  • Il parcourt les données des données moins détaillées aux données très détaillées.

Tranche

L'opération de tranche sélectionne une dimension particulière à partir d'un cube donné et fournit un nouveau sous-cube. Considérez le diagramme suivant qui montre le fonctionnement de la tranche.

  • Ici Slice est effectué pour la dimension "temps" en utilisant le critère temps = "Q1".

  • Il formera un nouveau sous-cube en sélectionnant une ou plusieurs dimensions.

Dice sélectionne deux dimensions ou plus à partir d'un cube donné et fournit un nouveau sous-cube. Considérez le diagramme suivant qui montre le fonctionnement des dés.

L'opération de dés sur le cube basée sur les critères de sélection suivants implique trois dimensions.

  • (location = "Toronto" ou "Vancouver")
  • (heure = "Q1" ou "Q2")
  • (item = "Mobile" ou "Modem")

Pivot

L'opération de pivot est également connue sous le nom de rotation. Il fait pivoter les axes de données en vue afin de fournir une présentation alternative des données. Considérez le diagramme suivant qui montre l'opération de pivot.

OLAP contre OLTP

Sr.No. Entrepôt de données (OLAP) Base de données opérationnelle (OLTP)
1 Implique un traitement historique des informations. Implique le traitement au jour le jour.
2 Les systèmes OLAP sont utilisés par les travailleurs du savoir tels que les cadres, les gestionnaires et les analystes. Les systèmes OLTP sont utilisés par les commis, les administrateurs de base de données ou les professionnels des bases de données.
3 Utile pour analyser l'entreprise. Utile dans la gestion de l'entreprise.
4 Il se concentre sur l'information. Il se concentre sur les données au format.
5 Basé sur Star Schema, Snowflake, Schema et Fact Constellation Schema. Basé sur le modèle de relation d'entité.
6 Contient des données historiques. Contient les données actuelles.
sept Fournit des données résumées et consolidées. Fournit des données primitives et très détaillées.
8 Fournit une vue résumée et multidimensionnelle des données. Fournit une vue relationnelle détaillée et plate des données.
9 Le nombre d'utilisateurs est en centaines. Le nombre d'utilisateurs est en milliers.
dix Le nombre d'enregistrements consultés est en millions. Le nombre d'enregistrements consultés est en dizaines.
11 La taille de la base de données est comprise entre 100 Go et 1 To La taille de la base de données est comprise entre 100 Mo et 1 Go.
12 Très flexible. Fournit des performances élevées.