Test ETL vs base de données

Les tests ETL et les tests de bases de données impliquent la validation des données, mais ils ne sont pas les mêmes. Les tests ETL sont normalement effectués sur des données dans un système d'entrepôt de données, tandis que les tests de bases de données sont généralement effectués sur des systèmes transactionnels où les données proviennent de différentes applications dans la base de données transactionnelle.

Ici, nous avons mis en évidence les principales différences entre les tests ETL et les tests de bases de données.

Test ETL

Les tests ETL impliquent les opérations suivantes -

  • Validation du mouvement des données de la source vers le système cible.

  • Vérification du nombre de données dans le système source et cible.

  • Vérification de l'extraction et de la transformation des données selon les besoins et les attentes.

  • Vérifier si les relations de table - jointures et clés - sont conservées pendant la transformation.

Les outils de test ETL courants comprennent QuerySurge, Informatica, etc.

Test de base de données

Les tests de base de données mettent davantage l'accent sur l'exactitude des données, l'exactitude des données et les valeurs valides. Il implique les opérations suivantes -

  • Vérifier si les clés primaires et étrangères sont conservées.

  • Vérifier si les colonnes d'une table ont des valeurs de données valides.

  • Vérification de l'exactitude des données dans les colonnes. Example - La colonne Nombre de mois ne doit pas avoir une valeur supérieure à 12.

  • Vérification des données manquantes dans les colonnes. Vérifiez s'il existe des colonnes nulles qui devraient avoir une valeur valide.

Les outils de test de base de données courants incluent Selenium, QTP, etc.

Le tableau suivant présente les principales fonctionnalités des tests de base de données et ETL et leur comparaison -

Fonction Test de base de données Test ETL
Objectif principal Validation et intégration des données Extraction, transformation et chargement de données pour le reporting BI
Système applicable Système transactionnel où se déroule le flux commercial Système contenant des données historiques et non dans un environnement de flux commercial
Outils communs QTP, sélénium, etc. QuerySurge, Informatica, etc.
Besoin commercial Il est utilisé pour intégrer les données de plusieurs applications, impact sévère. Il est utilisé pour les rapports analytiques, les informations et les prévisions.
La modélisation Méthode ER Multidimensionnel
Type de base de données Il est normalement utilisé dans les systèmes OLTP Il est appliqué aux systèmes OLAP
Type de données Données normalisées avec plus de jointures Données dé-normalisées avec moins de jointures, plus d'index et d'agrégations.