Apache Pig - TextLoader ()
La fonction Pig Latin TextLoader() est une fonction de chargement utilisée pour charger des données non structurées au format UTF-8.
Syntaxe
Voici la syntaxe de TextLoader() fonction.
grunt> TextLoader()
Exemple
Supposons qu'il existe un fichier avec nommé stu_data.txt dans le répertoire HDFS nommé /data/ comme indiqué ci-dessous.
001,Rajiv_Reddy,21,Hyderabad
002,siddarth_Battacharya,22,Kolkata
003,Rajesh_Khanna,22,Delhi
004,Preethi_Agarwal,21,Pune
005,Trupthi_Mohanthy,23,Bhuwaneshwar
006,Archana_Mishra,23,Chennai
007,Komal_Nayak,24,trivendram
008,Bharathi_Nambiayar,24,Chennai
Maintenant, chargeons le fichier ci-dessus en utilisant le TextLoader() fonction.
grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();
Vous pouvez vérifier les données chargées à l'aide de l'opérateur Dump.
grunt> dump details;
(001,Rajiv_Reddy,21,Hyderabad)
(002,siddarth_Battacharya,22,Kolkata)
(003,Rajesh_Khanna,22,Delhi)
(004,Preethi_Agarwal,21,Pune)
(005,Trupthi_Mohanthy,23,Bhuwaneshwar)
(006,Archana_Mishra,23,Chennai)
(007,Komal_Nayak,24,trivendram)
(008,Bharathi_Nambiayar,24,Chennai)