Série chronologique - Modélisation

introduction

Une série chronologique comporte 4 composantes comme indiqué ci-dessous -

  • Level - C'est la valeur moyenne autour de laquelle varie la série.

  • Trend - C'est le comportement croissant ou décroissant d'une variable avec le temps.

  • Seasonality - C'est le comportement cyclique des séries temporelles.

  • Noise - C'est l'erreur dans les observations ajoutées en raison de facteurs environnementaux.

Techniques de modélisation de séries temporelles

Pour capturer ces composants, il existe un certain nombre de techniques de modélisation de séries chronologiques populaires. Cette section donne une brève introduction de chaque technique, mais nous en discuterons en détail dans les prochains chapitres -

Méthodes naïves

Ce sont des techniques d'estimation simples, telles que la valeur prédite reçoit la valeur égale à la moyenne des valeurs précédentes de la variable dépendante du temps ou de la valeur réelle précédente. Ceux-ci sont utilisés à des fins de comparaison avec des techniques de modélisation sophistiquées.

Régression automatique

La régression automatique prédit les valeurs des périodes futures en fonction des valeurs des périodes précédentes. Les prévisions d'auto-régression peuvent mieux correspondre aux données que celles des méthodes naïves, mais elles peuvent ne pas être en mesure de tenir compte de la saisonnalité.

Modèle ARIMA

Une moyenne mobile intégrée auto-régressive modélise la valeur d'une variable en fonction linéaire des valeurs précédentes et des erreurs résiduelles aux pas de temps précédents d'une série temporelle stationnaire. Cependant, les données du monde réel peuvent être non stationnaires et avoir une saisonnalité, c'est pourquoi Seasonal-ARIMA et Fractional-ARIMA ont été développés. ARIMA fonctionne sur des séries temporelles univariées, pour gérer plusieurs variables VARIMA a été introduit.

Lissage exponentiel

Il modélise la valeur d'une variable comme une fonction linéaire pondérée exponentielle des valeurs précédentes. Ce modèle statistique peut également gérer la tendance et la saisonnalité.

LSTM

Le modèle de mémoire à long terme (LSTM) est un réseau neuronal récurrent qui est utilisé pour les séries chronologiques afin de tenir compte des dépendances à long terme. Il peut être formé avec une grande quantité de données pour capturer les tendances dans des séries chronologiques à variables multiples.

Lesdites techniques de modélisation sont utilisées pour la régression de séries chronologiques. Dans les prochains chapitres, explorons maintenant tous ces éléments un par un.