Apache Pig - GetYear ()
Cette fonction accepte un objet date-heure comme paramètre et renvoie l'année en cours à partir de l'objet date-heure donné.
Syntaxe
Voici la syntaxe du GetYear() fonction.
grunt> GetYear(datetime)
Exemple
Supposons qu'il existe un fichier nommé date.txt dans le HDFS annuaire /pig_data/comme indiqué ci-dessous. Ce fichier contient les détails de la date de naissance d'une personne en particulier, il a l'identifiant de la personne, la date et l'heure.
date.txt
001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44
Et, nous avons chargé ce fichier dans Pig avec une relation nommée date_data comme indiqué ci-dessous.
grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',')
as (id:int,date:chararray);
Voici un exemple de GetYear()fonction. Il récupérera l'année en cours à partir de l'objet date-heure donné. Par conséquent, générons tout d'abord les objets date-heure de tous les employés en utilisanttodate() fonction comme indiqué ci-dessous.
grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
as (date_time:DateTime );
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30)
(1980-06-20T10:22:00.000+05:30)
(1990-12-19T03:11:44.000+05:30)
Obtenons maintenant l'année à partir de la date de naissance de chaque employé en utilisant le GetYear() fonction et stockez-le dans la relation nommée getyear_data.
grunt> getyear_data = foreach todate_data generate (date_time), GetYear(date_time);
Vérifiez maintenant le contenu de la relation getyear_data à l'aide de l'opérateur Dump comme indiqué ci-dessous.
grunt> Dump getyear_data;
(1989-09-26T09:00:00.000+05:30,1989)
(1980-06-20T10:22:00.000+05:30,1980)
(1990-12-19T03:11:44.000+05:30,1990)