Statistiques - Kurtosis

Le degré de queue d'une distribution est mesuré par kurtosis. Il nous indique dans quelle mesure la distribution est plus ou moins sujette aux valeurs aberrantes (plus lourdes ou à queue claire) que la distribution normale. Trois types de courbes différents, gracieuseté d'Investopedia, sont présentés comme suit -

Il est difficile de discerner différents types d'aplatissement à partir des graphiques de densité (panneau de gauche) car les queues sont proches de zéro pour toutes les distributions. Mais les différences dans les queues sont faciles à voir dans les graphiques quantiles-quantiles normaux (panneau de droite).

La courbe normale est appelée courbe mésokurtique. Si la courbe d'une distribution est plus sujette à des valeurs aberrantes (ou à queue plus lourde) qu'une courbe normale ou mésokurtique, elle est alors appelée courbe leptokurtique. Si une courbe est moins sujette à des valeurs aberrantes (ou à queue plus claire) qu'une courbe normale, elle est appelée courbe platykurtique. Le kurtosis est mesuré par des moments et est donné par la formule suivante -

Formule

$ {\ beta_2 = \ frac {\ mu_4} {\ mu_2}} $

Où -

  • $ {\ mu_4 = \ frac {\ sum (x- \ bar x) ^ 4} {N}} $

Plus la valeur de \ beta_2 est élevée, plus la courbe est crête ou leptokurtique. Une courbe normale a une valeur de 3, un leptokurtic a \ beta_2 supérieur à 3 et platykurtic a \ beta_2 inférieur à 3.

Exemple

Problem Statement:

Les données sur les salaires journaliers de 45 ouvriers d'une usine sont données. Calculez \ beta_1 et \ beta_2 en utilisant le moment de la moyenne. Commentez les résultats.

Salaire (Rs.) Nombre de travailleurs
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

Solution:

Salaire
(Rs.)
Nombre de travailleurs
(f)
Mi-pt
m
m - $ {\ frac {170} {20}} $
d
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
  $ {N = 45} $     $ {\ sum fd = 10} $ $ {\ sum fd ^ 2 = 64} $ $ {\ sum fd ^ 3 = 40} $ $ {\ sum fd ^ 4 = 330} $

Puisque les écarts ont été pris à partir d'une moyenne supposée, nous calculons donc d'abord les moments sur l'origine arbitraire, puis les moments sur la moyenne. Moments sur l'origine arbitraire '170'

$ {\ mu_1 ^ 1 = \ frac {\ sum fd} {N} \ times i = \ frac {10} {45} \ times 20 = 4,44 \\ [7pt] \ mu_2 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ times i ^ 2 = \ frac {64} {45} \ times 20 ^ 2 = 568.88 \\ [7pt] \ mu_3 ^ 1 = \ frac {\ sum fd ^ 2} {N} \ fois i ^ 3 = \ frac {40} {45} \ fois 20 ^ 3 = 7111.11 \\ [7pt] \ mu_4 ^ 1 = \ frac {\ sum fd ^ 4} {N} \ fois i ^ 4 = \ frac {330} {45} \ times 20 ^ 4 = 1173333.33} $

Moments sur la moyenne

$ {\ mu_2 = \ mu'_2 - (\ mu'_1) ^ 2 = 568,88- (4,44) ^ 2 = 549,16 \\ [7pt] \ mu_3 = \ mu'_3 - 3 (\ mu'_1) (\ mu'_2) + 2 (\ mu'_1) ^ 3 \\ [7pt] \, = 7111,11 - (4,44) (568,88) + 2 (4,44) ^ 3 \\ [7pt] \, = 7111,11 - 7577,48 + 175,05 = - 291,32 \\ [7pt] \\ [7pt] \ mu_4 = \ mu'_4 - 4 (\ mu'_1) (\ mu'_3) + 6 (\ mu_1) ^ 2 (\ mu'_2) -3 (\ mu'_1) ^ 4 \\ [7pt] \, = 1173333.33 - 4 (4,44) (7111,11) +6 (4,44) ^ 2 (568,88) - 3 (4,44) ^ 4 \\ [7pt] \, = 1173333.33 - 126293.31 + 67288.03-1165.87 \\ [7pt] \, = 1113162.18} $

À partir de la valeur du mouvement autour de la moyenne, nous pouvons maintenant calculer $ {\ beta_1} $ et $ {\ beta_2} $:

$ {\ beta_1 = \ mu ^ 2_3 = \ frac {(- 291,32) ^ 2} {(549,16) ^ 3} = 0,00051 \\ [7pt] \ beta_2 = \ frac {\ mu_4} {(\ mu_2) ^ 2 } = \ frac {1113162.18} {(546.16) ^ 2} = 3.69} $

D'après les calculs ci-dessus, on peut conclure que $ {\ beta_1} $, qui mesure l'asymétrie, est presque nul, indiquant ainsi que la distribution est presque symétrique. $ {\ beta_2} $ qui mesure le kurtosis, a une valeur supérieure à 3, ce qui implique que la distribution est leptokurtique.