Tracé - Diagramme de densité Distplots et tracé à barres d'erreur

Dans ce chapitre, nous allons comprendre en détail les distplots, le graphique de densité et le graphique à barres d'erreur. Commençons par découvrir les distplots.

Distplots

L'usine de figures distplot affiche une combinaison de représentations statistiques de données numériques, telles que l'histogramme, l'estimation de la densité du noyau ou la courbe normale et le tracé de tapis.

Le distplot peut être composé de tout ou d'une combinaison des 3 composants suivants -

  • histogram
  • courbe: (a) estimation de la densité du noyau ou (b) courbe normale, et
  • parcelle de tapis

le figure_factory module a create_distplot() fonction qui nécessite un paramètre obligatoire appelé hist_data.

Le code suivant crée un distplot de base composé d'un histogramme, d'un graphique kde et d'un graphique de tapis.

x = np.random.randn(1000)
hist_data = [x]
group_labels = ['distplot']
fig = ff.create_distplot(hist_data, group_labels)
iplot(fig)

La sortie du code mentionné ci-dessus est la suivante -

Diagramme de densité

Un graphique de densité est une version continue et lissée d'un histogramme estimé à partir des données. La forme d'estimation la plus courante est connue sous le nom dekernel density estimation (KDE). Dans cette méthode, une courbe continue (le noyau) est dessinée à chaque point de données individuel et toutes ces courbes sont ensuite additionnées pour faire une seule estimation de densité lisse.

le create_2d_density() fonction dans le module plotly.figure_factory._2d_density renvoie un objet figure pour un tracé de densité 2D.

Le code suivant est utilisé pour produire un tracé de densité 2D sur des données d'histogramme.

t = np.linspace(-1, 1.2, 2000)
x = (t**3) + (0.3 * np.random.randn(2000))
y = (t**6) + (0.3 * np.random.randn(2000))
fig = ff.create_2d_density( x, y)
iplot(fig)

Ci-dessous mentionné est la sortie du code donné ci-dessus.

Tracé de la barre d'erreur

Les barres d'erreur sont des représentations graphiques de l'erreur ou de l'incertitude dans les données, et elles aident à une interprétation correcte. À des fins scientifiques, le signalement des erreurs est essentiel pour comprendre les données fournies.

Les barres d'erreur sont utiles pour les résolveurs de problèmes, car les barres d'erreur indiquent la confiance ou la précision d'un ensemble de mesures ou de valeurs calculées.

La plupart des barres d'erreur représentent la plage et l'écart type d'un jeu de données. Ils peuvent aider à visualiser comment les données sont réparties autour de la valeur moyenne. Des barres d'erreur peuvent être générées sur divers graphiques tels que le graphique à barres, le graphique linéaire, le nuage de points, etc.

le go.Scatter() la fonction a error_x et error_y propriétés qui contrôlent la manière dont les barres d'erreur sont générées.

  • visible (boolean) - Détermine si cet ensemble de barres d'erreur est visible ou non.

La propriété de type a des valeurs possibles "percent"|"constant"|"sqrt"|"data». Il définit la règle utilisée pour générer les barres d'erreur. Si "pourcentage", les longueurs des barres correspondent à un pourcentage des données sous-jacentes. Définissez ce pourcentage dans «valeur». Si "sqrt", les longueurs des barres correspondent au carré des données sous-jacentes. Si "data", les longueurs des barres sont définies avec l'ensemble de données "array".

  • symmetricla propriété peut être vraie ou fausse. En conséquence, les barres d'erreur auront la même longueur dans les deux sens ou non (haut / bas pour les barres verticales, gauche / droite pour les barres horizontales.

  • array- définit les données correspondant à la longueur de chaque barre d'erreur. Les valeurs sont tracées par rapport aux données sous-jacentes.

  • arrayminus - Définit les données correspondant à la longueur de chaque barre d'erreur dans la direction inférieure (gauche) pour les barres verticales (horizontales) Les valeurs sont tracées par rapport aux données sous-jacentes.

Le code suivant affiche des barres d'erreur symétriques sur un nuage de points -

trace = go.Scatter(
   x = [0, 1, 2], y = [6, 10, 2],
   error_y = dict(
   type = 'data', # value of error bar given in data coordinates
   array = [1, 2, 3], visible = True)
)
data = [trace]
layout = go.Layout(title = 'Symmetric Error Bar')
fig = go.Figure(data = data, layout = layout)
iplot(fig)

Ci-dessous est la sortie du code indiqué ci-dessus.

Le tracé d'erreur asymétrique est rendu par le script suivant -

trace = go.Scatter(
   x = [1, 2, 3, 4], 
   y =[ 2, 1, 3, 4],
   error_y = dict(
      type = 'data',
      symmetric = False,
      array = [0.1, 0.2, 0.1, 0.1], 
      arrayminus = [0.2, 0.4, 1, 0.2]
   )
)
data = [trace]
layout = go.Layout(title = 'Asymmetric Error Bar')
fig = go.Figure(data = data, layout = layout)
iplot(fig)

La sortie de la même chose est celle donnée ci-dessous -