Tableau - Fusion de données

La fusion de données est une fonctionnalité très puissante de Tableau. Il est utilisé lorsqu'il existe des données associées dans plusieurs sources de données, que vous souhaitez analyser ensemble dans une seule vue. À titre d'exemple, considérons que les données de vente sont présentes dans une base de données relationnelle et les données de cible de vente dans une feuille de calcul Excel. Désormais, pour comparer les ventes réelles aux ventes cibles, vous pouvez fusionner les données en fonction de dimensions communes pour accéder à la mesure Sales Target. Les deux sources impliquées dans la fusion des données sont appelées sources de données primaires et secondaires. Une jointure gauche est créée entre la source de données principale et la source de données secondaire avec toutes les lignes de données des lignes de données principales et correspondantes de la source de données secondaire.

Préparation des données pour la fusion

Tableau a deux sources de données intégrées nommées Sample-superstore et Sample coffee chain.mdb qui sera utilisé pour illustrer le mélange de données.

Commencez par charger l'exemple de chaîne de café dans Tableau et regardez ses métadonnées. Allez dans le menu - Données → Nouvelle source de données et recherchez le fichier d'exemple de chaîne de café, qui est un fichier de base de données MS Access. La capture d'écran suivante montre les différentes tables et jointures disponibles dans le fichier.

Ajout d'une source de données secondaire

Ensuite, ajoutez la source de données secondaire nommée Sample-superstore en suivant à nouveau les étapes - Données → Nouvelle source de données et en choisissant cette source de données. Les deux sources de données apparaissent maintenant dans la fenêtre Données, comme illustré dans la capture d'écran suivante.

Mélanger les données

Vous pouvez désormais intégrer les données des deux sources ci-dessus en fonction d'une dimension commune. Notez qu'une petite image de chaîne apparaît à côté de la dimension nommée State. Cela indique la dimension commune entre les deux sources de données. Faites glisser le champ État de la source de données principale vers l'étagère des lignes et le champ Ratio de profit de la source de données secondaire vers l'étagère Colonnes. Ensuite, sélectionnez l'option de graphique à puces dans Montrez-moi pour obtenir le graphique à puces illustré dans la capture d'écran suivante. Le graphique montre comment le ratio de profit varie pour chaque État dans les supermarchés et les chaînes de cafés.