Approfondissez votre compréhension du Big Data avec notre formation exhaustive.
Du concept initial à son état actuel, nous examinons les origines et les implications du Big Data en tant que matière première.
Nous vous introduirons à l’écosystème Hadoop, y compris HDFS, MapReduce, HBase, Pig et Hive, Hue, et Flume.
Nous explorerons également les solutions alternatives telles que Lucene et Solr, et discuterons de la relation entre le Cloud et le Big Data.
Vous apprendrez comment acquérir, traiter et obtenir des résultats à partir des données Big Data, et comment croiser vos propres données avec le Big Data.
Nous examinerons les différentes bases de données, de SGBDR à NoSQL, et les avantages de chaque approche.
Enfin, nous conclurons avec des exemples de cas d’utilisation du Big Data et une vue d’ensemble des données Big Data disponibles en libre-service.
Programme détaillé
Introduction
- Les origines du Big Data
- La donnée en tant que matière première
- La connaissance de la question
Big Data : des solutions à portée de main
- Présentation de l'écosystème Hadoop
-
- Introduction
- HDFS
- MapReduce
- HBase
- Pig et Hive
- Hue
- Flume
- Distributions (Cloudera, MapR, Hortonworks)
- Lucene, Solr
- Solutions alternatives
Relations entre Cloud et Big Data
- Motivations des Clouds publics et privés
- Les Clouds de stockage
- Traitement des données dans le Cloud
Big Data : traitements, de l'acquisition jusqu'au résultat
- L'enchainement des opérations
- La connaissance de la question
Croiser ses données avec le Big Data
- La structure comme critère de classification : non structurées, structurées, semi structurées
- Les solutions potentielles
Méthodes de traitement et champs d'application
- Du SGBDR au NoSQL
- Les différents types de bases de données
- Bénéfices : navigation, recherche des données, nouveaux types de données, fédération des entrepôts de données existants
Cas d'usage et conclusion
- L'anticipation, la sécurité et les recommandations
- Exemples de cas d'utilisation
Big Data en libre service
- Tour d'horizon sur les données Big Data déjà disponibles
Architecture et utilisation des composants Hadoop (théorie et mise en pratique)
- HDFS
-
- Architecture, commandes shell
- MapReduce
-
- Architectures MapReduce v1, YARN
- Exécution d'un traitement MapReduce
- Supervision
- HBase
-
- Architecture
- Utilisation de la base de données NoSQL (famille de colonnes, versions)
- Hive
-
- Architecture, utilisation du langage Hive QL (tables, tables externes, partitions)
- Interrogation des données