SAS - Méthodes de saisie

Les méthodes d'entrée sont utilisées pour lire les données brutes. Les données brutes peuvent provenir d'une source externe ou de lignes de données en flux. L'instruction d'entrée crée une variable avec le nom que vous attribuez à chaque champ. Vous devez donc créer une variable dans l'instruction d'entrée. La même variable sera affichée dans la sortie du jeu de données SAS. Vous trouverez ci-dessous différentes méthodes de saisie disponibles dans SAS.

  • Méthode d'entrée de liste
  • Méthode d'entrée nommée
  • Méthode d'entrée de colonne
  • Méthode d'entrée formatée

Les détails de chaque méthode d'entrée sont décrits ci-dessous.

Méthode d'entrée de liste

Dans cette méthode, les variables sont répertoriées avec les types de données. Les données brutes sont soigneusement analysées afin que l'ordre des variables déclarées corresponde aux données. Le délimiteur (généralement un espace) doit être uniforme entre toute paire de colonnes adjacentes. Toute donnée manquante causera un problème dans la sortie car le résultat sera faux.

Exemple

Le code suivant et la sortie montrent l'utilisation de la méthode d'entrée de liste.

DATA TEMP;
INPUT   EMPID ENAME $ DEPT $ ;
DATALINES;
1 Rick  IT
2 Dan  OPS
3 Tusar  IT
4 Pranab  OPS
5 Rasmi  FIN
;
PROC PRINT DATA = TEMP;
RUN;

En exécutant le code ci-dessus, nous obtenons la sortie suivante.

Méthode d'entrée nommée

Dans cette méthode, les variables sont répertoriées avec les types de données. Les données brutes sont modifiées pour avoir des noms de variables déclarés devant les données correspondantes. Le délimiteur (généralement un espace) doit être uniforme entre toute paire de colonnes adjacentes.

Exemple

Le code suivant et la sortie montrent l'utilisation de la méthode d'entrée nommée.

DATA TEMP;
INPUT   
EMPID= ENAME= $ DEPT= $ ;
DATALINES;
EMPID = 1 ENAME = Rick  DEPT = IT
EMPID = 2 ENAME = Dan  DEPT = OPS
EMPID = 3 ENAME = Tusar  DEPT = IT
EMPID = 4 ENAME = Pranab  DEPT = OPS
EMPID = 5 ENAME = Rasmi  DEPT = FIN
;
PROC PRINT DATA = TEMP;
RUN;

En exécutant le code ci-dessus, nous obtenons la sortie suivante.

Méthode d'entrée de colonne

Dans cette méthode, les variables sont répertoriées avec les types de données et la largeur des colonnes qui spécifient la valeur de la seule colonne de données. Par exemple, si le nom d'un employé contient au maximum 9 caractères et que chaque nom d'employé commence à la 10e colonne, la largeur de colonne pour la variable de nom d'employé sera de 10 à 19.

Exemple

Le code suivant montre l'utilisation de la méthode d'entrée de colonne.

DATA TEMP;
INPUT   EMPID 1-3 ENAME $ 4-12 DEPT $ 13-16;
DATALINES;
14 Rick     IT 
241Dan      OPS 
30 Sanvi    IT 
410Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -

Méthode d'entrée formatée

Dans cette méthode, les variables sont lues à partir d'un point de départ fixe jusqu'à ce qu'un espace soit rencontré. Comme chaque variable a un point de départ fixe, le nombre de colonnes entre n'importe quelle paire de variables devient la largeur de la première variable. Le caractère '@n' est utilisé pour spécifier la position de la colonne de départ d'une variable comme nième colonne.

Exemple

Le code suivant montre l'utilisation de la méthode d'entrée formatée

DATA TEMP;
INPUT   @1 EMPID $ @4 ENAME $ @13 DEPT $ ;
DATALINES;
14 Rick     IT 
241 Dan      OPS 
30 Sanvi    IT 
410 Chanchal OPS 
52 Piyu     FIN 
;
PROC PRINT DATA = TEMP;
RUN;

Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -