SAS - Test d'hypothèses

Le test d'hypothèse est l'utilisation de statistiques pour déterminer la probabilité qu'une hypothèse donnée soit vraie. Le processus habituel de test d'hypothèse comprend quatre étapes, comme indiqué ci-dessous.

Étape 1

Formulez l'hypothèse nulle H0 (généralement, que les observations sont le résultat du pur hasard) et l'hypothèse alternative H1 (généralement, que les observations montrent un effet réel combiné avec une composante de variation aléatoire).

Étape 2

Identifiez une statistique de test qui peut être utilisée pour évaluer la véracité de l'hypothèse nulle.

Étape 3

Calculez la valeur P, qui est la probabilité qu'une statistique de test au moins aussi significative que celle observée soit obtenue en supposant que l'hypothèse nulle était vraie. Plus la valeur P est petite, plus la preuve contre l'hypothèse nulle est solide.

Étape 4

Comparez la valeur p à une valeur de signification alpha acceptable (parfois appelée valeur alpha). Si p <= alpha, que l'effet observé est statistiquement significatif, l'hypothèse nulle est exclue et l'hypothèse alternative est valide.

Le langage de programmation SAS a des fonctionnalités pour effectuer différents types de test d'hypothèse, comme indiqué ci-dessous.

Tester La description SAS PROC
T-Test Un test t est utilisé pour tester si la moyenne d'une variable est significativement différente d'une valeur hypothétique.Nous déterminons également si les moyennes pour deux groupes indépendants sont significativement différentes et si les moyennes des groupes dépendants ou appariés sont significativement différentes. PROC TTEST
ANOVA Il est également utilisé pour comparer les moyennes lorsqu'il existe une variable catégorielle indépendante. Nous voulons utiliser une ANOVA unidirectionnelle lors des tests pour voir si les moyennes de la variable dépendante de l'intervalle sont différentes en fonction de la variable catégorielle indépendante. PROC ANOVA
Chi-Square Nous utilisons la qualité de l'ajustement du chi carré pour évaluer si les fréquences d'une variable catégorielle étaient susceptibles de se produire en raison du hasard. L'utilisation d'un test du chi carré est nécessaire si les proportions d'une variable catégorielle sont une valeur hypothétique. PROC FREQ
Linear Regression La régression linéaire simple est utilisée lorsque l'on veut tester la capacité d'une variable à prédire une autre variable. La régression linéaire multiple permet de tester dans quelle mesure plusieurs variables prédisent une variable d'intérêt. Lors de l'utilisation de la régression linéaire multiple, nous supposons en outre que les variables prédictives sont indépendantes. PROC REG