ggplot2 - Série chronologique

Une série chronologique est un tracé graphique qui représente la série de points de données dans un ordre temporel spécifique. Une série chronologique est une séquence prise avec une séquence à des points temporels successifs égaux. Les séries chronologiques peuvent être considérées comme des données en temps discret. L'ensemble de données que nous utiliserons dans ce chapitre est un ensemble de données «économiques» qui comprend tous les détails des séries chronologiques économiques américaines.

Le dataframe comprend les attributs suivants qui sont mentionnés ci-dessous -

Date Mois de collecte de données
Psavert Taux d'épargne personnelle
Pce Dépenses de consommation personnelle
Chômage Nombre de chômeurs en milliers
Sans empreinte Durée médiane du chômage
Pop Population totale en milliers

Chargez les packages requis et définissez le thème par défaut pour créer une série chronologique.

> library(ggplot2)
> theme_set(theme_minimal())
> # Demo dataset
> head(economics)
# A tibble: 6 x 6
date           pce            pop          psavert       uempmed       unemploy
<date>         <dbl>         <dbl>         <dbl>         <dbl>         <dbl>
1 1967-07-01    507.          198712        12.6          4.5           2944
2 1967-08-01    510.          198911        12.6          4.7           2945
3 1967-09-01    516.          199113        11.9          4.6           2958
4 1967-10-01    512.          199311        12.9          4.9           3143
5 1967-11-01    517.          199498        12.8          4.7           3066
6 1967-12-01    525.          199657        11.8          4.8           3018

Créez un tracé linéaire de base qui crée une structure de série chronologique.

> # Basic line plot
> ggplot(data = economics, aes(x = date, y = pop))+
+ geom_line(color = "#00AFBB", size = 2)

Nous pouvons tracer le sous-ensemble de données en utilisant la commande suivante -

> # Plot a subset of the data
> ss <- subset(economics, date > as.Date("2006-1-1"))
> ggplot(data = ss, aes(x = date, y = pop)) +
+ geom_line(color = "#FC4E07", size = 2)

Création de séries chronologiques

Ici, nous allons tracer les variables psavert et uempmed par les dates. Ici, nous devons remodeler les données à l'aide du package tidyr. Ceci peut être réalisé en réduisant les valeurs psavert et uempmed dans la même colonne (nouvelle colonne). Fonction R: rassembler () [tidyr]. L'étape suivante consiste à créer une variable de regroupement avec des niveaux = psavert et uempmed.

> library(tidyr)
> library(dplyr)
Attaching package: ‘dplyr’
The following object is masked from ‘package:ggplot2’: vars
The following objects are masked from ‘package:stats’: filter, lag
The following objects are masked from ‘package:base’: intersect, setdiff, setequal, union
> df <- economics %>%
+    select(date, psavert, uempmed) %>%
+    gather(key = "variable", value = "value", -date)
> head(df, 3)
# A tibble: 3 x 3
date          variable     value
<date> <chr>   <dbl>
1 1967-07-01   psavert       12.6
2 1967-08-01   psavert       12.6
3 1967-09-01   psavert       11.9

Créez un tracé sur plusieurs lignes à l'aide de la commande suivante pour examiner la relation entre «psavert» et «sans empreinte» -

> ggplot(df, aes(x = date, y = value)) +
+    geom_line(aes(color = variable), size = 1) +
+    scale_color_manual(values = c("#00AFBB", "#E7B800")) +
+    theme_minimal()