ggplot2 - Diagrammes à barres et histogrammes

Les graphiques à barres représentent les données catégorielles de manière rectangulaire. Les barres peuvent être tracées verticalement et horizontalement. Les hauteurs ou longueurs sont proportionnelles aux valeurs représentées dans les graphiques. Les axes x et y des graphiques à barres spécifient la catégorie qui est incluse dans un jeu de données spécifique.

L'histogramme est un graphique à barres qui représente les données brutes avec une image claire de la distribution de l'ensemble de données mentionné.

Dans ce chapitre, nous nous concentrerons sur la création de graphiques à barres et d'histogrammes à l'aide de ggplot2.

Comprendre l'ensemble de données MPG

Comprenons l'ensemble de données qui sera utilisé. L'ensemble de données MPG contient un sous-ensemble des données d'économie de carburant que l'EPA met à disposition dans le lien ci-dessous -

http://fueleconomy.gov

Il se compose de modèles qui ont eu une nouvelle version chaque année entre 1999 et 2008. Cela a été utilisé comme indicateur de la popularité de la voiture.

La commande suivante est exécutée pour comprendre la liste des attributs nécessaires pour l'ensemble de données.

> library(ggplot2)

Le package joint est ggplot2.

L'objet suivant est masqué _par_ .GlobalEnv -

mpg

Messages d'avertissement

  • le paquet arules a été construit sous la version R 3.5.1
  • le package tuneR a été construit sous la version R 3.5.3
  • le paquet ggplot2 a été construit sous la version R 3.5.3

Création d'un tracé de comptage de barres

Le tracé du nombre de barres peut être créé avec le tracé mentionné ci-dessous -

> # A bar count plot
> p <- ggplot(mpg, aes(x=factor(cyl)))+
+    geom_bar(stat="count")
> p

geom_bar () est la fonction utilisée pour créer des graphiques à barres. Il prend l'attribut de valeur statistique appelé count.

Histogramme

Le tracé de comptage d'histogramme peut être créé avec le tracé mentionné ci-dessous -

> # A historgram count plot
> ggplot(data=mpg, aes(x=hwy)) +
+    geom_histogram( col="red",
+       fill="green",
+       alpha = .2,
+       binwidth = 5)

geom_histogram () inclut tous les attributs nécessaires pour créer un histogramme. Ici, il prend l'attribut de hwy avec le nombre respectif. La couleur est prise selon les exigences.

Graphique à barres empilées

Les graphiques généraux des graphiques à barres et de l'histogramme peuvent être créés comme ci-dessous -

> p <- ggplot(mpg, aes(class))
> p + geom_bar()
> p + geom_bar()

Ce graphique comprend toutes les catégories définies dans les graphiques à barres avec la classe respective. Ce tracé est appelé graphique empilé.