SAS - Histogrammes

Un histogramme est un affichage graphique de données à l'aide de barres de différentes hauteurs. Il regroupe les différents nombres de l'ensemble de données en plusieurs plages. Il représente également l'estimation de la probabilité de distribution d'une variable continue. En SAS lePROC UNIVARIATE est utilisé pour créer des histogrammes avec les options ci-dessous.

Syntaxe

La syntaxe de base pour créer un histogramme dans SAS est -

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

Voici la description des paramètres utilisés -

  • DATASET est le nom de l'ensemble de données utilisé.

  • variables sont les valeurs utilisées pour tracer l'histogramme.

Histogramme simple

Un histogramme simple est créé en spécifiant le nom de la variable et la plage à considérer pour regrouper les valeurs.

Exemple

Dans l'exemple ci-dessous, nous considérons les valeurs minimum et maximum de la puissance variable et prenons une plage de 50. Ainsi, les valeurs forment un groupe par incréments de 50.

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

Lorsque nous exécutons le code ci-dessus, nous obtenons la sortie suivante -

Histogramme avec ajustement de courbe

Nous pouvons ajuster certaines courbes de distribution dans l'histogramme en utilisant des options supplémentaires.

Exemple

Dans l'exemple ci-dessous, nous ajustons une courbe de distribution avec des valeurs moyennes et d'écart type mentionnées comme EST. Cette option utilise et estimation des paramètres.

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

Lorsque nous exécutons le code ci-dessus, nous obtenons la sortie suivante -