Apache Pig - GetYear ()

Cette fonction accepte un objet date-heure comme paramètre et renvoie l'année en cours à partir de l'objet date-heure donné.

Syntaxe

Voici la syntaxe du GetYear() fonction.

grunt> GetYear(datetime)

Exemple

Supposons qu'il existe un fichier nommé date.txt dans le HDFS annuaire /pig_data/comme indiqué ci-dessous. Ce fichier contient les détails de la date de naissance d'une personne en particulier, il a l'identifiant de la personne, la date et l'heure.

date.txt

001,1989/09/26 09:00:00
002,1980/06/20 10:22:00
003,1990/12/19 03:11:44

Et, nous avons chargé ce fichier dans Pig avec une relation nommée date_data comme indiqué ci-dessous.

grunt> date_data = LOAD 'hdfs://localhost:9000/pig_data/date.txt' USING PigStorage(',')
   as (id:int,date:chararray);

Voici un exemple de GetYear()fonction. Il récupérera l'année en cours à partir de l'objet date-heure donné. Par conséquent, générons tout d'abord les objets date-heure de tous les employés en utilisanttodate() fonction comme indiqué ci-dessous.

grunt> todate_data = foreach date_data generate ToDate(date,'yyyy/MM/dd HH:mm:ss')
   as (date_time:DateTime );
  
grunt> Dump todate_data;
(1989-09-26T09:00:00.000+05:30) 
(1980-06-20T10:22:00.000+05:30) 
(1990-12-19T03:11:44.000+05:30)

Obtenons maintenant l'année à partir de la date de naissance de chaque employé en utilisant le GetYear() fonction et stockez-le dans la relation nommée getyear_data.

grunt> getyear_data = foreach todate_data generate (date_time), GetYear(date_time);

Vérifiez maintenant le contenu de la relation getyear_data à l'aide de l'opérateur Dump comme indiqué ci-dessous.

grunt> Dump getyear_data;
  
(1989-09-26T09:00:00.000+05:30,1989) 
(1980-06-20T10:22:00.000+05:30,1980) 
(1990-12-19T03:11:44.000+05:30,1990)