ggplot2 - Nuage de points et tracés de gigue

Les nuages ​​de points sont similaires aux graphiques linéaires qui sont généralement utilisés pour le traçage. Les nuages ​​de points montrent à quel point une variable est liée à une autre. La relation entre les variables est appelée corrélation qui est généralement utilisée dans les méthodes statistiques. Nous utiliserons le même jeu de données appelé «Iris» qui comprend de nombreuses variations entre chaque variable. Il s'agit d'un célèbre jeu de données qui donne des mesures en centimètres des variables longueur et largeur des sépales avec longueur et largeur des pétales pour 50 fleurs de chacune des 3 espèces d'iris. Les espèces sont appelées Iris setosa, versicolor et virginica.

Création d'un nuage de points de base

Les étapes suivantes sont impliquées pour créer des nuages ​​de points avec le package «ggplot2» -

Pour créer un nuage de points de base, la commande suivante est exécutée -

> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point()

Ajouter des attributs

Nous pouvons changer la forme des points avec une propriété appelée shape dans la fonction geom_point ().

> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point(shape=1)

Nous pouvons ajouter de la couleur aux points qui sont ajoutés dans les nuages ​​de points requis.

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1)

Dans cet exemple, nous avons créé des couleurs selon les espèces mentionnées dans les légendes. Les trois espèces se distinguent de manière unique dans la parcelle mentionnée.

Nous allons maintenant nous concentrer sur l'établissement de relations entre les variables.

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

geom_smooth La fonction facilite le modèle de chevauchement et crée le modèle des variables requises.

La méthode attributaire «lm» mentionne la droite de régression qui doit être développée.

> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

Nous pouvons également ajouter une ligne de régression sans région de confiance ombrée avec la syntaxe mentionnée ci-dessous -

># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm, se=FALSE)

Les régions ombrées représentent des choses autres que les régions de confiance.

Tracés de gigue

Les graphiques de gigue incluent des effets spéciaux avec lesquels des graphiques dispersés peuvent être représentés. La gigue n'est rien d'autre qu'une valeur aléatoire attribuée aux points pour les séparer comme mentionné ci-dessous -

> ggplot(mpg, aes(cyl, hwy)) +
+    geom_point() +
+    geom_jitter(aes(colour = class))