Python - Mesure de la variance

Dans les statistiques, la variance est une mesure de l'écart entre une valeur d'un ensemble de données et la valeur moyenne. En d'autres termes, il indique à quel point les valeurs sont dispersées. Il est mesuré en utilisant l'écart type. L'autre méthode couramment utilisée est l'asymétrie.

Ces deux éléments sont calculés à l'aide des fonctions disponibles dans la bibliothèque pandas.

Mesure de l'écart type

L'écart type est la racine carrée de la variance. la variance est la moyenne de la différence au carré des valeurs dans un ensemble de données par rapport à la valeur moyenne. En python, nous calculons cette valeur en utilisant la fonction std () de la bibliothèque pandas.

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)

# Calculate the standard deviation
print df.std()

Ses output est comme suit -

Age       7.265527
Rating    0.661628
dtype: float64

Mesure de l'asymétrie

Il sert à déterminer si les données sont symétriques ou asymétriques. Si l'indice est compris entre -1 et 1, alors la distribution est symétrique. Si l'indice n'est pas supérieur à -1, il est incliné vers la gauche et s'il est au moins égal à 1, il est incliné vers la droite

import pandas as pd

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack',
   'Lee','Chanchal','Gasper','Naviya','Andres']),
   'Age':pd.Series([25,26,25,23,30,25,23,34,40,30,25,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}

#Create a DataFrame
df = pd.DataFrame(d)
print df.skew()

Ses output est comme suit -

Age       1.443490
Rating   -0.153629
dtype: float64

Ainsi, la distribution de la classification par âge est symétrique tandis que la distribution de l'âge est biaisée vers la droite.