SAS - Variables

En général, les variables de SAS représentent les noms de colonnes des tables de données analysées. Mais il peut également être utilisé à d'autres fins, comme l'utiliser comme compteur dans une boucle de programmation. Dans le chapitre actuel, nous verrons l'utilisation de variables SAS comme noms de colonne de l'ensemble de données SAS.

Types de variables SAS

SAS a trois types de variables comme ci-dessous -

Variables numériques

Il s'agit du type de variable par défaut. Ces variables sont utilisées dans les expressions mathématiques.

Syntaxe

INPUT VAR1 VAR2 VAR3; 		#Define numeric variables in the data set.

Dans la syntaxe ci-dessus, l'instruction INPUT affiche la déclaration des variables numériques.

Exemple

INPUT ID SALARY COMM_PERCENT;

Variables de caractères

Les variables de caractère sont utilisées pour les valeurs qui ne sont pas utilisées dans les expressions mathématiques. Ils sont traités comme du texte ou des chaînes. Une variable devient une variable de caractère en ajoutant un $ sing avec un espace à la fin du nom de la variable.

Syntaxe

INPUT VAR1 $ VAR2 $ VAR3 $; 	#Define character variables in the data set.

Dans la syntaxe ci-dessus, l'instruction INPUT affiche la déclaration des variables de caractère.

Exemple

INPUT FNAME $ LNAME $ ADDRESS $;

Variables de date

Ces variables sont traitées uniquement comme des dates et doivent être dans des formats de date valides. Une variable devient une variable de date en ajoutant un format de date avec un espace à la fin du nom de la variable.

Syntaxe

INPUT VAR1 DATE11. VAR2 MMDDYY10. ; #Define date variables in the data set.

Dans la syntaxe ci-dessus, l'instruction INPUT affiche la déclaration des variables de date.

Exemple

INPUT DOB DATE11. START_DATE MMDDYY10. ;

Utilisation de variables dans le programme SAS

Les variables ci-dessus sont utilisées dans le programme SAS comme indiqué dans les exemples ci-dessous.

Exemple

Le code ci-dessous montre comment les trois types de variables sont déclarés et utilisés dans un programme SAS

DATA TEMP;
INPUT ID NAME $ SALARY DEPT $ DOJ DATE9. ;
FORMAT DOJ DATE9. ;
DATALINES;
1 Rick 623.3 IT 02APR2001
2 Dan 515.2 OPS 11JUL2012
3 Michelle 611 IT 21OCT2000
4 Ryan 729 HR 30JUL2012
5 Gary 843.25 FIN 06AUG2000
6 Tusar 578 IT 01MAR2009
7 Pranab 632.8 OPS 16AUG1998
8 Rasmi 722.5 FIN 13SEP2014
;
PROC PRINT DATA = TEMP;
RUN;

Dans l'exemple ci-dessus, toutes les variables de caractères sont déclarées suivies d'un signe $ et les variables de date sont déclarées suivies d'un format de date. La sortie du programme ci-dessus est comme ci-dessous.

Utilisation des variables

Les variables sont très utiles pour analyser les données. Ils sont utilisés dans les expressions dans lesquelles l'analyse statistique est appliquée. Voyons un exemple d'analyse de l'ensemble de données intégré nomméCARS qui est présent sous Libraries → My Libraries → SASHELP. Double-cliquez dessus pour explorer les variables et leurs types de données.

Ensuite, nous pouvons produire une statistique récapitulative de certaines de ces variables en utilisant les options Tâches dans SAS studio. Aller àTasks -> Statistics -> Summary Statisticset double-cliquez dessus pour ouvrir la fenêtre comme indiqué ci-dessous. Choisissez l'ensemble de donnéesSASHELP.CARSet sélectionnez les trois variables - MPG_CITY, MPG_Highway et Weight sous les Variables d'analyse. Maintenez la touche Ctrl enfoncée tout en sélectionnant les variables en cliquant. Cliquez sur exécuter.

Cliquez sur l'onglet des résultats après les étapes ci-dessus. Il montre le résumé statistique des trois variables choisies. La dernière colonne indique le nombre d'observations (enregistrements) utilisées dans l'analyse.