SAS - Écart type

L'écart type (ET) est une mesure de la variation des données dans un ensemble de données. Mathématiquement, il mesure la distance ou la proximité de chaque valeur par rapport à la valeur moyenne d'un ensemble de données. Une valeur d'écart type proche de 0 indique que les points de données ont tendance à être très proches de la moyenne de l'ensemble de données et un écart type élevé indique que les points de données sont répartis sur une plage de valeurs plus large

Dans SAS, les valeurs SD sont mesurées en utilisant PROC MEAN ainsi que PROC SURVEYMEANS.

Utilisation de PROC MEANS

Pour mesurer le SD en utilisant proc meansnous choisissons l'option STD dans l'étape PROC. Il fait ressortir les valeurs SD pour chaque variable numérique présente dans l'ensemble de données.

Syntaxe

La syntaxe de base pour le calcul de l'écart type dans SAS est -

PROC means DATA = dataset STD;

Voici la description des paramètres utilisés -

  • Dataset - est le nom de l'ensemble de données.

Exemple

Dans l'exemple ci-dessous, nous créons l'ensemble de données CARS1 à partir de l'ensemble de données CARS dans la bibliothèque SASHELP. Nous choisissons l'option STD avec l'étape PROC means.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

Lorsque nous exécutons le code ci-dessus, il donne la sortie suivante -

Utilisation de PROC SURVEYMEANS

Cette procédure est également utilisée pour la mesure de l'écart-type avec certaines fonctionnalités avancées telles que la mesure de l'écart-type pour les variables catégorielles ainsi que pour fournir des estimations de la variance.

Syntaxe

La syntaxe d'utilisation de PROC SURVEYMEANS est -

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

Voici la description des paramètres utilisés -

  • BY - indique les variables utilisées pour créer des groupes d'observations.

  • CLASS - indique les variables utilisées pour les variables catégorielles.

  • VAR - indique les variables pour lesquelles SD sera calculé.

Exemple

L'exemple ci-dessous décrit l'utilisation de class option qui crée les statistiques pour chacune des valeurs de la variable de classe.

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Lorsque nous exécutons le code ci-dessus, il donne la sortie suivante -

Utilisation de l'option BY

Le code ci-dessous donne un exemple d'option BY. Dans celui-ci, le résultat est regroupé pour chaque valeur dans l'option BY.

Exemple

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

Lorsque nous exécutons le code ci-dessus, il donne la sortie suivante -

Résultat pour make = "Audi"

Résultat pour make = "BMW"