Découvrez notre formation complète en Big Data, conçue pour fournir une compréhension approfondie des concepts fondamentaux du Big Data, son importance et son écosystème.

Cette formation s’adresse à tous ceux qui souhaitent maîtriser les technologies clés comme Hadoop, Apache Spark et les bases de données NoSQL.

Elle couvre des aspects tels que les systèmes de fichiers distribués, le stockage objet, et la gestion de données massives. Les participants apprendront à manipuler, stocker et analyser des mégadonnées en utilisant des outils tels qu’Apache Hive, Pig, et Impala.

De plus, une introduction à la Data Science est incluse, offrant des connaissances en analyse de données avec Python et Jupyter, manipulation de données avec Pandas, et modélisation en apprentissage automatique.

Les concepts théoriques sont renforcés par des démonstrations pratiques, des exercices, et des études de cas, permettant aux participants de développer des compétences pratiques dans l’exécution de tâches MapReduce ou Spark et l’exploration de données massives. Rejoignez-nous pour maîtriser le Big Data et ses applications dans un contexte réel.

Objectifs pédagogiques

À l’issue de la formation, les participants seront capables de :

Comprendre les concepts fondamentaux du Big Data et son importance
Connaître l’écosystème Big Data et les principales technologies associées
Acquérir des compétences pratiques dans l’utilisation d’Apache Hadoop et Spark
Explorer les bases de données distribuées et leur rôle dans le Big Data
Maîtriser les outils d’analyse tels que Apache Hive, Pig, et Impala
Appliquer les connaissances acquises à travers des études de cas pratiques

Public concerné

DSI, Directeur Technique, Chef de Projet, Architecte SI, Administrateur de bases de données (DBA)

Prérequis

intérêt pour les nouvelles technologies.

Programme détaillé

Introduction au big data (1 heure)

Comment définir le big data ?
La caractérisation des mégadonnées à travers les 5V
Architecture

Technologies du Big Data (2 heures)

Hadoop et écosystème
Apache Spark
Bases de données NoSQL

Stockage et Gestion de Données Massives (1,5 heure)

Systèmes de fichiers distribués
Stockage objet
Systèmes de gestion de fichiers distribués

Démonstration et cas pratique (2,5 heures)

Démonstration pratique
- Installation et Configuration
- Exécution de tâches MapReduce ou Spark
- Exploration de données massives
Cas pratique
- Manipulation de Big Data
- Résolution de Problèmes

Introduction à la Data Science (1 heure)

Définition et Rôle
Processus CRISP-DM

Analyse de Données avec Python et Jupyter (2 heures)

Introduction à Python
Utilisation de Jupyter Notebooks
Manipulation de Données avec Pandas

Modélisation et Apprentissage Automatique (1 heure)

Types de Modèles ML
Sélection et Prétraitement des Données
Mise en œuvre des Modèles

Démonstration et cas pratique (3 heures)

Démonstration pratique
- Création de Modèles avec scikit-learn
- Evaluation des performances
- Exercices pratiques
Cas pratique
- Application des concepts
- Réglage des hyperparamètres

Délais d'accès à la formation

Les inscriptions sont possibles jusqu'à 48 heures avant le début de la formation.

Dans le cas d'une formation financée par le CPF, ENI Service est tenu de respecter un délai minimum obligatoire de 11 jours ouvrés entre la date d'envoi de sa proposition et la date de début de la formation.

Modalités et moyens pédagogiques, techniques et d'encadrement

Formation avec un formateur, qui peut être suivie selon l’une des 3 modalités ci-dessous :

1 - Dans la salle de cours en présence du formateur.

2 - Dans l’une de nos salles de cours immersives, avec le formateur présent physiquement à distance. Les salles immersives sont équipées d’un système de visio-conférence HD et complétées par des outils pédagogiques qui garantissent le même niveau de qualité.

3 - Depuis votre domicile ou votre entreprise. Vous rejoignez un environnement de formation en ligne, à l’aide de votre ordinateur, tout en étant éloigné physiquement du formateur et des autres participants. Vous êtes en totale immersion avec le groupe et participez à la formation dans les mêmes conditions que le présentiel. Pour plus d’informations : Le téléprésentiel – notre solution de formation à distance.

Le nombre de stagiaires peut varier de 1 à 12 personnes (5 à 6 personnes en moyenne), ce qui facilite le suivi permanent et la proximité avec chaque stagiaire.

Chaque stagiaire dispose d’un poste de travail adapté aux besoins de la formation, d’un support de cours et/ou un manuel de référence au format numérique ou papier.

Pour une meilleure assimilation, le formateur alterne tout au long de la journée les exposés théoriques, les démonstrations et la mise en pratique au travers d’exercices et de cas concrets réalisés seul ou en groupe.

Modalités d'évaluation des acquis

En début et en fin de formation, les stagiaires réalisent une auto-évaluation de leurs connaissances et compétences en lien avec les objectifs de la formation. L’écart entre les deux évaluations permet ainsi de mesurer leurs acquis.

En complément, le formateur évalue chaque stagiaire sur l'atteinte des objectifs pédagogiques de la formation selon quatre niveaux (non évalué, non acquis, en cours d'acquisition, acquis). Cette évaluation repose sur une modalité choisie par le formateur en cohérence avec la formation : QCM, exercices pratiques réalisés pendant la formation, évaluation finale de synthèse, quiz interactif de validation, étude de cas, mise en situation, analyse de l’auto-évaluation, autres modalités adaptées.

Pour les stagiaires qui le souhaitent, certaines formations peuvent être validées officiellement par un examen de certification. Les candidats à la certification doivent produire un travail personnel important en vue de se présenter au passage de l'examen, le seul suivi de la formation ne constitue pas un élément suffisant pour garantir un bon résultat et/ou l'obtention de la certification.

Pour certaines formations certifiantes (ex : ITIL, DPO, ...), le passage de l'examen de certification est inclus et réalisé en fin de formation. Les candidats sont alors préparés par le formateur au passage de l'examen tout au long de la formation.

Moyens de suivi d'exécution et appréciation des résultats

Feuille de présence, émargée par demi-journée par chaque stagiaire et le formateur.
Evaluation qualitative de fin de formation, qui est ensuite analysée par l'équipe pédagogique ENI.
Attestation de fin de formation, remise au stagiaire en main propre ou par courrier électronique.

Qualification du formateur

La formation est animée par un professionnel de l’informatique et de la pédagogie, dont les compétences techniques, professionnelles et pédagogiques ont été validées par des certifications et/ou testées et approuvées par les éditeurs et/ou notre équipe pédagogique.

Il est en veille technologique permanente et possède plusieurs années d’expérience sur les produits, technologies et méthodes enseignés.

Il est présent auprès des stagiaires pendant toute la durée de la formation.

Accessibilité de la formation

ENI Service s'engage en faveur de l'accessibilité pour les personnes en situation de handicap (PSH). Toutes nos formations sont ainsi accessibles aux PSH. Pour en savoir plus, nous vous invitons à consulter la page Accueil des personnes en situation de handicap de notre site internet.