SAS - Chi carré

Un test du chi carré est utilisé pour examiner l'association entre deux variables catégorielles. Il peut être utilisé pour tester à la fois le degré de dépendance et le degré d'indépendance entre les variables. SAS utilisePROC FREQ avec l'option chisq pour déterminer le résultat du test du chi carré.

Syntaxe

La syntaxe de base pour appliquer PROC FREQ pour le test Chi-Square dans SAS est -

PROC FREQ DATA = dataset;
TABLES variables 
/CHISQ TESTP = (percentage values);

Voici la description des paramètres utilisés -

  • Dataset est le nom de l'ensemble de données.

  • Variables sont les noms de variables de l'ensemble de données utilisé dans le test du chi carré.

  • Percentage Values dans l'instruction TESTP représentent le pourcentage de niveaux de la variable.

Exemple

Dans l'exemple ci-dessous, nous considérons un test du chi carré sur la variable nommée type dans l'ensemble de données SASHELP.CARS. Cette variable a six niveaux et nous attribuons un pourcentage à chaque niveau selon la conception du test.

proc freq data = sashelp.cars;
tables type 
/chisq 
testp = (0.20 0.12 0.18 0.10 0.25 0.15);
run;

Lorsque le code ci-dessus est exécuté, nous obtenons le résultat suivant -

Nous obtenons également le graphique à barres montrant l'écart du type de variable, comme indiqué dans la capture d'écran suivante.

Chi-carré bidirectionnel

Le test du chi carré bidirectionnel est utilisé lorsque nous appliquons les tests à deux variables de l'ensemble de données.

Exemple

Dans l'exemple ci-dessous, nous appliquons le test du chi carré sur deux variables nommées type et origine. Le résultat montre la forme tabulaire de toutes les combinaisons de ces deux variables.

proc freq data = sashelp.cars;
tables type*origin 
/chisq 
;
run;

Lorsque le code ci-dessus est exécuté, nous obtenons le résultat suivant -