Apache Pig - TOBAG ()

le TOBAG()La fonction Pig Latin convertit une ou plusieurs expressions en tuples individuels. Et ces tuples sont placés dans un sac.

Syntaxe

Ci-dessous, la syntaxe du TOBAG() fonction.

TOBAG(expression [, expression ...])

Exemple

Supposons que nous ayons un fichier nommé employee_details.txt dans le répertoire HDFS /pig_data/, avec le contenu suivant.

employee_details.txt

001,Robin,22,newyork
002,BOB,23,Kolkata
003,Maya,23,Tokyo 
004,Sara,25,London 
005,David,23,Bhuwaneshwar 
006,Maggy,22,Chennai

Nous avons chargé ce fichier dans Pig avec le nom de la relation emp_data comme indiqué ci-dessous.

grunt> emp_data = LOAD 'hdfs://localhost:9000/pig_data/employee_details.txt' USING PigStorage(',')
   as (id:int, name:chararray, age:int, city:chararray);

Convertissons maintenant l'identifiant, le nom, l'âge et la ville de chaque employé (enregistrement) en un tuple comme indiqué ci-dessous.

tobag = FOREACH emp_data GENERATE TOBAG (id,name,age,city);

Vérification

Vous pouvez vérifier le contenu du tobag relation utilisant le Dump opérateur comme indiqué ci-dessous.

grunt> DUMP tobag;
  
({(1),(Robin),(22),(newyork)}) 
({(2),(BOB),(23),(Kolkata)}) 
({(3),(Maya),(23),(Tokyo)}) 
({(4),(Sara),(25),(London)}) 
({(5),(David),(23),(Bhuwaneshwar)}) 
({(6),(Maggy),(22),(Chennai)})