Dans cette formation dédiée à Apache Pig, apprenez à utiliser Pig Latin, le langage procédural de cet outil de traitement de données Hadoop.
Découvrez comment charger et manipuler des données de divers types et formats, comment optimiser les traitements générés et comment utiliser des librairies Pig externes.
Comprenez les différentes commandes et opérations utiles telles que FILTER, ORDER, GROUP, et FOREACH.
.
.
GENERATE.
De plus, apprenez à étendre Pig avec des fonctions définies par l’utilisateur (User Defined Functions).
Programme détaillé
›
Présentation du Pig Latin
- Utilisation
- Fonctionnement
- Syntaxe
- Types
Chargement des données
- PigStorage
- Schémas
- Commande DESCRIBE
Sauvegarde de données
- DUMP
- STORE
Autres commandes utiles - cat
Traitement des données
Opérateurs
- FILTER
- ORDER
- GROUP
- FOREACH… GENERATE
- FLATTEN
Fonctions
- Chaînes de caractères
- Mathématiques
- Exemple - Compteur de mots, version Pig
Etendre Pig
- User Defined Functions