Formation Hadoop : Deploiement + Administration

Public : Tous

Durée : 5 jour(s)

Syllabus de la formation Hadoop : Deploiement + Administration

Pré-requis : Connaissances en administration système, préférablement Java

Objectifs : Comprendre le Big Data et ses enjeux - Savoir déployer Hadoop et son écosystème - Comprendre HDFS, MapReduce - Structurer les données avec HBase - Ecrire des requêtes avec HiveQL - Installer les services d'un nœud Hadoop - Assembler plusieurs nœuds Hadoop - Déployer une nouvelle application sur un cluster existant - Effectuer une restauration de données suite à une reprise sur incident

Sanction : Attestation de fin de formation mentionnant le résultat des acquis

Référence : BUS101732-F

Accessibilité : Si vous êtes en situation de handicap, nous sommes en mesure de vous accueillir, n'hésitez pas à nous contacter à referenthandicap@dawan.fr, nous étudierons ensemble vos besoins

Contact : commercial@dawan.fr

Télécharger le programme

INTER INTRA DISTANCE TUTORAT

3 875,00 CHF HT

Tarif plein :

Paiement à 60 jours
Report possible à J-3
3 tickets d'assistance

Contacter Dawan

Programme de Formation Hadoop : Deploiement + Administration

Introduction au Big Data

Qu'est-ce que le Big Data ?
Source des données : l'homme, la machine
La problématique de taille
Position de Hadoop dans le paysage

Introduction à Hadoop

L'origine du projet
Le système de fichiers HDFS
Comprendre l'algorithme MapReduce
L'environnement d'Hadoop : HBase, ZooKeeper, Hive, Pig…
L'API YARN

Mettre Hadoop en place : HDFS

Du mode autonome au mode complètement distribué en cluster
Pré-requis, distributions Hadoop
Cluster Hadoop : NameNode, ResourceManager, DataNode, NodeManager
Les fichiers de configuration
Opérations de base sur le cluster HDFS : formatage, démarrage, arrêt

Atelier pratique : installer Hadoop sur 2 nœuds, formater et manipuler HDFS

Travailler avec MapReduce

L'intérêt de MapReduce
Mappers, reducers, parallélisme et indépendance des traitements
Entrées, sorties
Soumission d'un job à Hadoop

Atelier pratique : exécuter une tâche via MapReduce, avec sortie dans HDFS

Une base de données distribuée : HBase

L'accès aléatoire, temps réel, lecture-écriture au Big Data
Fonctionnalités de HBase, NoSQL
Pré-requis, configuration
Manipulation via le shell HBase

Atelier pratique : mettre en place HBase sur Hadoop, créer et manipuler une table

Et pourquoi pas un peu de SQL avec Hive ?

Présentation de Hive
Gérer le schéma : bases, tables, vues, partitions
Manipulation des données, requêtes et map-reduce avec HiveQL
Audits et journal d'erreurs

Atelier pratique : chargement de données massives dans Hive, requêtes

Aller plus loin avec Hadoop

Gérer les logs et l'audit de tâches Hadoop
Découvrir MRUnit pour les test unitaires dans Hadoop
Débogage en local
Surveillance des perfomances

Atelier pratique : mise en place d'un job MapReduce plus complexe avec traces et tests unitaires

Administration de Hadoop

Présentation d’un nœud existant
Organisation des services et étude du séquencement avec YARN

Atelier : modifier la taille des blocs HDFS pour diminuer le nombre de Map/Reduce

Mettre Hadoop en place

Relation entre la plateforme installée et les framework de développement
Proposer de frameworks indépendants pour assurer la compatibilité : Spring Data

Atelier : déployer une application d’accès à HBase au travers d’un mapping O/R Spring Data

Travailler avec MapReduce

Déployer un programme Map/Reduce sur un cluster de nœuds Hadoop
Recherche des logs
Remonter les anomalies aux développeurs
Proposer l’usage de file Kafka

Atelier : utilisation de file d’entrée sortie pour un programme Map/Reduce

Routage de données

Définition de routes logicielles
Mettre en place un cas de calcul où les données déclenchent les programmes

Atelier : faire un routage de données depuis un répertoire HDFS vers une file Kafka qui est l’entrée d’un programme Map/Reduce

Utilisation des vues

Utilisation des vues Ambari
Visualisation de l’état des nœuds d’un cluster
Importer/exporter des fichiers de configuration

Atelier : relancer une grappe de services, utilisation des vues YARN et Tez

Gestion des droits

Gestion des comptes utilisateurs
Gestion des droits de fichier sur un système de fichier distribué
Utilisation de certificat

Atelier : configurer les services Knox et Ranger

Délai d'accès :Le délai d’accès à la formation certifiante est de 7 jours après validation du dossier. Dans le cas d’un financement via votre CPF, la validation de votre dossier devra être réalisée 11 jours ouvrés avant le début de formation

Modalités d’évaluation : Les évaluations en cours de formations sont réalisées par les ateliers de mise en pratique et les échanges avec les formateurs

Un support et les exercices du cours pour chaque stagiaire
Un formateur expert ayant suivi une formation à la pédagogie et ayant au minimum 3 années d'expériences dans le domaine visé
Boissons offertes pendant les pauses en inter-entreprises
Salles lumineuses et locaux facilement accessibles
Méthodologie basée sur l'Active Learning : 75% de pratique minimum
Matériel pour les formations présentielles informatiques : un PC par participant
Positionnement à l'entrée et à la sortie de la formation
Certification CPF quand formation éligible
Délai d’accès : D'une à trois semaines en fonction des sessions ouvertes

Suite de parcours et formations associées

Pour suivre une session à distance depuis l'un de nos centres, contactez-nous.

Lieu	Date	Actions
Distance	Du 01/09/2025 au 05/09/2025	S'inscrire
Distance	Du 24/11/2025 au 28/11/2025	S'inscrire
Genève	Du 04/08/2025 au 08/08/2025	S'inscrire
Genève	Du 03/11/2025 au 07/11/2025	S'inscrire

Nos centres de formation

Distance

32 Boulevard Vincent Gâche

44000 Nantes
Genève

c/o CCI France Suisse Route de Jussy 35 Case postale 6298

CH-1211 Thônex - Genève

Formation Hadoop : Deploiement + Administration

Syllabus de la formation Hadoop : Deploiement + Administration

Tarif plein :

Programme de Formation Hadoop : Deploiement + Administration

Introduction au Big Data

Introduction à Hadoop

Mettre Hadoop en place : HDFS

Travailler avec MapReduce

Une base de données distribuée : HBase

Et pourquoi pas un peu de SQL avec Hive ?

Aller plus loin avec Hadoop

Administration de Hadoop

Mettre Hadoop en place

Travailler avec MapReduce

Routage de données

Utilisation des vues

Gestion des droits

Suite de parcours et formations associées

Nos centres de formation

Distance

Genève

Nous traitons vos données personnelles pour :