Entreposage de données - Questions d'entretien

Chers lecteurs, ces Data Warehousing Interview Questions ont été spécialement conçus pour vous familiariser avec la nature des questions que vous pourriez rencontrer lors de votre entretien sur le sujet de Data Warehousing.

Q: Define data warehouse?

A : L'entrepôt de données est une collection de données orientée sujet, intégrée, variable dans le temps et non volatile qui prend en charge le processus décisionnel de la direction.

Q: What does subject-oriented data warehouse signify?

A : Orienté sujet signifie que l'entrepôt de données stocke les informations autour d'un sujet particulier tel que le produit, le client, les ventes, etc.

Q: List any five applications of data warehouse.

A : Certaines applications incluent les services financiers, les services bancaires, les biens de consommation, les secteurs de la vente au détail, la fabrication contrôlée.

Q: What do OLAP and OLTP stand for?

A : OLAP est un acronyme pour Online Analytical Processing et OLTP est un acronyme de Traitement transactionnel en ligne.

Q: What is the very basic difference between data warehouse and operational databases?

A : Un entrepôt de données contient des informations historiques qui sont mises à disposition pour l'analyse de l'entreprise, tandis qu'une base de données opérationnelle contient les informations actuelles nécessaires à la gestion de l'entreprise.

Q: List the Schema that a data warehouse system can implements.

A : Un entrepôt de données peut implémenter un schéma en étoile, un schéma en flocon de neige et un schéma de constellation de faits.

Q: What is Data Warehousing?

A : L'entreposage de données est le processus de construction et d'utilisation de l'entrepôt de données.

Q: List the process that are involved in Data Warehousing.

A : L'entreposage de données implique le nettoyage des données, l'intégration des données et la consolidation des données.

Q: List the functions of data warehouse tools and utilities.

A : Les fonctions exécutées par l'outil et les utilitaires de l'entrepôt de données sont l'extraction de données, le nettoyage des données, la transformation des données, le chargement et l'actualisation des données.

Q: What do you mean by Data Extraction?

A : L'extraction de données signifie la collecte de données à partir de plusieurs sources hétérogènes.

Q: Define metadata?

A: Les métadonnées sont simplement définies comme des données sur les données. En d'autres termes, nous pouvons dire que les métadonnées sont les données résumées qui nous mènent aux données détaillées.

Q: What does Metadata Respiratory contain?

A : Les métadonnées respiratoires contiennent la définition de l'entrepôt de données, les métadonnées commerciales, les métadonnées opérationnelles, les données pour la cartographie de l'environnement opérationnel à l'entrepôt de données et les algorithmes de synthèse.

Q: How does a Data Cube help?

A: Le cube de données nous aide à représenter les données dans plusieurs dimensions. Le cube de données est défini par des dimensions et des faits.

Q: Define dimension?

A : Les dimensions sont les entités par rapport auxquelles une entreprise conserve les enregistrements.

Q: Explain data mart.

A: Le magasin de données contient le sous-ensemble de données à l'échelle de l'organisation. Ce sous-ensemble de données est précieux pour des groupes spécifiques d'une organisation. En d'autres termes, on peut dire qu'un data mart contient des données spécifiques à un groupe particulier.

Q: What is Virtual Warehouse?

A : La vue sur un entrepôt de données opérationnel est appelée entrepôt virtuel.

Q: List the phases involved in the data warehouse delivery process.

A : Les étapes sont la stratégie informatique, l'éducation, l'analyse de rentabilité, le plan technique, la création de la version, le chargement de l'historique, la requête ad hoc, l'évolution des exigences, l'automatisation et l'extension de la portée.

Q: Define load manager.

A: Un gestionnaire de charge effectue les opérations nécessaires pour extraire et charger le processus. La taille et la complexité du gestionnaire de charge varient entre les solutions spécifiques, de l'entrepôt de données à l'entrepôt de données.

Q: Define the functions of a load manager.

A: Un gestionnaire de charge extrait les données du système source. Chargez rapidement les données extraites dans le magasin de données temporaire. Effectuez des transformations simples en structure similaire à celle de l'entrepôt de données.

Q: Define a warehouse manager.

A: Le responsable de l'entrepôt est responsable du processus de gestion de l'entrepôt. Le gestionnaire d'entrepôt se compose de logiciels système tiers, de programmes C et de scripts shell. La taille et la complexité du gestionnaire d'entrepôt varient selon les solutions spécifiques.

Q: Define the functions of a warehouse manager.

A : Le responsable de l'entrepôt effectue des contrôles de cohérence et d'intégrité référentielle, crée les index, les vues d'entreprise, les vues de partition par rapport aux données de base, transforme et fusionne les données source dans le magasin temporaire dans l'entrepôt de données publié, sauvegarde les données dans l'entrepôt de données, et archive les données qui ont atteint la fin de leur vie capturée.

Q: What is Summary Information?

A : Les informations récapitulatives sont la zone de l'entrepôt de données dans laquelle les agrégations prédéfinies sont conservées.

Q: What does the Query Manager responsible for?

A : Query Manager est chargé de diriger les requêtes vers les tables appropriées.

Q: List the types of OLAP server

A : Il existe quatre types de serveurs OLAP, à savoir les serveurs OLAP relationnel, OLAP multidimensionnel, OLAP hybride et les serveurs SQL spécialisés.

Q: Which one is faster, Multidimensional OLAP or Relational OLAP?

A : OLAP multidimensionnel est plus rapide que OLAP relationnel.

Q: List the functions performed by OLAP.

A : OLAP exécute des fonctions telles que roll-up, drill-down, slice, dice et pivot.

Q: How many dimensions are selected in Slice operation?

A : Une seule dimension est sélectionnée pour l'opération de tranche.

Q: How many dimensions are selected in dice operation?

A : Pour le fonctionnement des dés, deux dimensions ou plus sont sélectionnées pour un cube donné.

Q: How many fact tables are there in a star schema?

A : Il n'y a qu'une seule table de faits dans un schéma en étoile.

Q: What is Normalization?

A : La normalisation divise les données en tables supplémentaires.

Q: Out of star schema and snowflake schema, whose dimension table is normalized?

A : Le schéma Snowflake utilise le concept de normalisation.

Q: What is the benefit of normalization?

A : La normalisation aide à réduire la redondance des données.

Q: Which language is used for defining Schema Definition?

A : Le langage de requête d'exploration de données (DMQL) est utilisé pour la définition de schéma.

Q: What language is the base of DMQL?

A : DMQL est basé sur le langage de requête structuré (SQL).

Q: What are the reasons for partitioning?

A : Le partitionnement est effectué pour diverses raisons telles qu'une gestion facile, pour aider la récupération de sauvegarde, pour améliorer les performances.

Q: What kind of costs are involved in Data Marting?

A : Data Marting implique le coût du matériel et des logiciels, le coût d'accès au réseau et le coût du temps.