Evolution MM

Formations à l'informatique
Découvrez la différence ENI

Lien accueil

Téléchargez le Calendrier des formations

Nantes, Rennes, Niort, Nice, Paris

jusqu'à juillet 2018

Rechercher
Rechercher une formation
 

Big Data - Etat de l'art

Public :

  • DSI, Directeur Technique, Chef de Projet, Architecte, Consultant, Administrateur de bases de données.

Objectifs :

  • Assimiler les concepts du Big Data ;
  • Connaître les différentes solutions Big Data disponibles sur le marché ;
  • Appréhender l'architecture d'un système Hadoop ;
  • Etre capable d'interroger les données au sein d'un système Hadoop.

Pré-requis :

  • Il est conseillé de connaître le langage SQL.

Contenu pédagogique

Introduction

  • Les origines du Big Data
  • La donnée en tant que matière première
  • La connaissance de la question

Big Data : des solutions à portée de main

  • Présentation de l'écosystème Hadoop
    • Introduction
    • HDFS
    • MapReduce
    • HBase
    • Pig et Hive
    • Hue
    • Flume
    • Distributions (Cloudera, MapR, Hortonworks)
  • Lucene, Solr
  • Solutions alternatives

Relations entre Cloud et Big Data

  • Motivations des Clouds publics et privés
  • Les Clouds de stockage
  • Traitement des données dans le Cloud

Big Data : traitements, de l'acquisition jusqu'au résultat

  • L'enchainement des opérations
  • La connaissance de la question

Croiser ses données avec le Big Data

  • La structure comme critère de classification : non structurées, structurées, semi structurées
  • Les solutions potentielles

Méthodes de traitement et champs d'application

  • Du SGBDR au NoSQL
  • Les différents types de bases de données
  • Bénéfices : navigation, recherche des données, nouveaux types de données, fédération des entrepôts de données existants

Cas d'usage et conclusion

  • L'anticipation, la sécurité et les recommandations
  • Exemples de cas d'utilisation

Big Data en libre service

  • Tour d'horizon sur les données Big Data déjà disponibles

Architecture et utilisation des composants Hadoop (théorie et mise en pratique)

  • HDFS
    • Architecture, commandes shell
  • MapReduce
    • Architectures MapReduce v1, YARN
    • Exécution d'un traitement MapReduce
    • Supervision
  • HBase
    • Architecture
    • Utilisation de la base de données NoSQL (famille de colonnes, versions)
  • Hive
    • Architecture, utilisation du langage Hive QL (tables, tables externes, partitions)
    • Interrogation des données
Durée : 2 jour(s)
Tarif : 1 590 € (HT)
Réf : VE800-001

Dates des sessions

Nantes (44) 27/09/18 Rennes (35) 27/09/18 Paris (75) 27/09/18 Niort (79) 27/09/18 Nice (06) 27/09/18