Apache Pig - ALÉATOIRE ()

le RANDOM() La fonction est utilisée pour obtenir un nombre pseudo aléatoire (type double) supérieur ou égal à 0,0 et inférieur à 1,0.

grunt> RANDOM()

Exemple

Supposons qu'il existe un fichier nommé math.txt dans le HDFS annuaire /pig_data/. Ce fichier contient des valeurs entières et en virgule flottante comme indiqué ci-dessous.

math.txt

5 
16 
9 
2.5 
5.9 
3.1

Et, nous avons chargé ce fichier dans Pig avec une relation nommée math_data comme indiqué ci-dessous.

grunt> math_data = LOAD 'hdfs://localhost:9000/pig_data/math.txt' USING PigStorage(',')
   as (data:float);

Générons maintenant des valeurs aléatoires du contenu du fichier math.txt en utilisant RANDOM() fonction comme indiqué ci-dessous.

grunt> random_data = foreach math_data generate (data), RANDOM();

L'instruction ci-dessus stocke le résultat dans la relation nommée random_data. Vérifiez le contenu de la relation à l'aide de l'opérateur Dump comme indiqué ci-dessous.

grunt> Dump random_data;
  
(5.0,0.6842057767279982) 
(16.0,0.9725172591786139) 
(9.0,0.4159326414649489) 
(2.5,0.30962777780713147) 
(5.9,0.705213727551145) 
(3.1,0.24247708413861724)