Evolution MM

Formations à l'informatique
Découvrez la différence ENI

Lien accueil

Téléchargez le Calendrier des formations

Nantes, Rennes, Niort, Nice, Paris

jusqu'à juillet 2019

Rechercher
Rechercher une formation
 

Apache Pig - Mise en oeuvre et programmation

Pig se rapproche plus d'un ETL et représente un outil de traitement de données de la suite Hadoop.
Pig s'appuie sur son propre langage, ainsi les différentes étapes de la transformation sont exprimées dans un langage procédural (Pig Latin) ce qui permet d'effectuer la production des scripts.

Public :

  • Directeurs techniques, chefs de projets, architectes, consultants, administrateurs de bases de données, développeurs d'applications

Objectifs :

  • Avoir une vue d'ensemble de l'architecture de Apache Pig ;
  • Connaître les fonctionnalités générales et les capacités de Apache Pig ;
  • Charger et de manipuler des données de types et formats différents ;
  • Optimiser les traitements générés ;
  • Utiliser des librairies Pig externes.

Pré-requis :

  • Avoir des connaissances générales sur le Big Data et l'infrastructure Apache Hadoop.

Contenu pédagogique

Présentation du Pig Latin

  • Utilisation
  • Fonctionnement
  • Syntaxe
  • Types

Chargement des données

  • PigStorage
  • Schémas
  • Commande DESCRIBE

Sauvegarde de données

  • DUMP
  • STORE

Autres commandes utiles - cat

Traitement des données

Opérateurs

  • FILTER
  • ORDER
  • GROUP
  • FOREACH… GENERATE
  • FLATTEN

Fonctions

  • Chaînes de caractères
  • Mathématiques
  • Exemple - Compteur de mots, version Pig

Etendre Pig

  • User Defined Functions
Durée : 2 jour(s)
Tarif : Consultez-nous
Réf : T265-022

Dates des sessions

Nantes (44) Consultez-nous Rennes (35) Consultez-nous Paris (75) Consultez-nous Niort (79) Consultez-nous Nice (06) Consultez-nous in-class™