Power BI - Modélisation des données

Dans ce chapitre, vous découvrirez la modélisation des données dans Power BI.

Utilisation de la modélisation et de la navigation des données

La modélisation des données est l'une des fonctionnalités utilisées pour connecter plusieurs sources de données dans l'outil BI à l'aide d'une relation. Une relation définit la manière dont les sources de données sont connectées les unes aux autres et vous pouvez créer des visualisations de données intéressantes sur plusieurs sources de données.

Avec la fonctionnalité de modélisation, vous pouvez créer des calculs personnalisés sur les tables existantes et ces colonnes peuvent être directement présentées dans des visualisations Power BI. Cela permet aux entreprises de définir de nouvelles mesures et d'effectuer des calculs personnalisés pour ces mesures.

Dans l'image ci-dessus, vous pouvez voir un modèle de données commun, qui montre une relation entre deux tables. Les deux tables sont jointes en utilisant un nom de colonne «Id».

De même, dans Power BI, vous définissez la relation entre deux objets. Pour définir la relation, vous devez faire glisser une ligne entre les colonnes communes. Vous pouvez également afficher la «relation» dans un modèle de données dans Power BI.

Pour créer un modèle de données dans Power BI, vous devez ajouter toutes les sources de données dans la nouvelle option de rapport Power BI. Pour ajouter une source de données, accédez à l'option Obtenir les données. Ensuite, sélectionnez la source de données que vous souhaitez connecter et cliquez sur le bouton Se connecter.

Une fois que vous avez ajouté une source de données, elle est présentée dans la barre latérale droite. Dans l'image suivante, nous avons utilisé 2 fichiers xls pour importer des données - Client et Produit.

Dans Power BI sur le côté gauche de l'écran, vous avez les trois onglets suivants -

  • Report
  • Data
  • Relationships

Lorsque vous accédez à l'onglet Rapport, vous pouvez voir un tableau de bord et un graphique sélectionnés pour la visualisation des données. Vous pouvez sélectionner différents types de graphiques selon vos besoins. Dans notre exemple, nous avons sélectionné un type de table parmi les visualisations disponibles.

Lorsque vous accédez à l'onglet Données, vous pouvez voir toutes les données selon la relation définie à partir des sources de données.

Dans l'onglet Relation, vous pouvez voir la relation entre les sources de données. Lorsque vous ajoutez plusieurs sources de données à la visualisation Power BI, l'outil tente automatiquement de détecter la relation entre les colonnes. Lorsque vous accédez à l'onglet Relation, vous pouvez afficher la relation. Vous pouvez également créer une relation entre les colonnes à l'aide de l'option Créer des relations.

Vous pouvez également ajouter et supprimer des relations dans la visualisation des données. Pour supprimer une relation, vous devez faire un clic droit et sélectionner l'option «Supprimer». Pour créer une nouvelle «Relation», il vous suffit de glisser-déposer les champs que vous souhaitez lier entre les sources de données.

Vous pouvez également utiliser la vue Relation pour masquer une colonne particulière dans le rapport. Pour masquer une colonne, cliquez avec le bouton droit sur le nom de la colonne et sélectionnez l'option «Masquer dans la vue rapport».

Création de colonnes calculées

Vous pouvez créer des colonnes calculées dans Power BI en combinant deux ou plusieurs éléments des données existantes. Vous pouvez également appliquer un calcul sur une colonne existante pour définir une nouvelle métrique ou combiner deux colonnes pour créer une nouvelle colonne.

Vous pouvez même créer une colonne calculée pour établir une relation entre les tables et elle peut également être utilisée pour configurer une relation entre deux tables.

Pour créer une nouvelle colonne calculée, accédez à l'onglet Affichage des données sur le côté gauche de l'écran, puis cliquez sur Modélisation.

Lorsque vous accédez à l'onglet Modélisation, vous pouvez voir une option Nouvelle colonne en haut de l'écran. Cela ouvre également la barre de formule, où vous pouvez entrer une formule DAX pour effectuer le calcul. L'expression d'analyse de données DAX est un langage puissant également utilisé dans Excel pour effectuer des calculs. Vous pouvez également renommer la colonne en modifiant le texte de la colonne dans la barre de formule.

Dans l'exemple suivant, créons une nouvelle colonne: Product Code (Product_C), qui est dérivé des trois derniers caractères de la colonne Prod_Id. Ensuite, écrivez la formule suivante -

Product_C = RIGHT( Sheet1[Prod_Id],3)

Une longue liste de formules est également fournie que vous pouvez utiliser pour créer des colonnes calculées. Vous devez entrer le premier caractère de la formule à utiliser dans les calculs, comme illustré dans la capture d'écran suivante.

Création de tableaux calculés

Vous pouvez également créer une nouvelle table calculée dans la modélisation de données dans Power BI. Pour créer une nouvelle table, accédez à l'onglet Affichage des données sur le côté gauche de l'écran, puis accédez à l'option Modélisation en haut de l'écran.

L'expression DAX est utilisée pour créer la nouvelle table. Vous devez entrer le nom d'une nouvelle table sur le côté gauche du signe égal et la formule DAX pour effectuer le calcul pour former cette table sur la droite. Une fois le calcul terminé, la nouvelle table apparaît dans le volet Champs de votre modèle.

Dans l'exemple suivant, définissons une nouvelle table - Table_CustC qui renvoie une table à une colonne contenant des valeurs uniques dans une colonne d'une autre table.

Une nouvelle table est ajoutée sous la section «Champs» de l'écran Power BI, comme illustré dans la capture d'écran suivante. Une fois la colonne calculée et les tables calculées créées selon vos besoins, vous pouvez utiliser les champs de l'onglet Rapport dans Power BI.

Pour ajouter ces objets, vous devez cocher une case et une relation est automatiquement détectée si possible. Sinon, vous pouvez faire glisser les colonnes que vous souhaitez connecter.

Pour afficher le rapport, accédez à l'onglet Rapport et vous pouvez voir à la fois «Colonnes calculées» et les champs du nouveau «Tableau calculé» dans la vue du rapport.

Gestion des données temporelles

Power BI permet par défaut d'explorer les données temporelles. Lorsque vous ajoutez un champ de date dans votre analyse et activez l'exploration de votre visualisation de données, cela vous amène au niveau suivant de données temporelles.

Considérons que nous avons ajouté une table basée sur le temps dans la visualisation Power BI. Nous avons ajouté la colonne Chiffre d'affaires et année dans notre rapport.

Nous pouvons activer la fonction d'exploration dans les visualisations à l'aide de l'option en haut. Une fois que nous avons activé la fonction d'exploration et cliqué sur les barres ou les lignes dans le graphique, elle passe au niveau suivant de la hiérarchie temporelle.Example: Années → Trimestres → Mois.

Nous pouvons également utiliser l'option Aller au niveau suivant dans l'option de hiérarchie pour effectuer une exploration.