Building Batch Data Analytics Solutions on AWS
Certificateur : AMAZON WEB SERVICES EMEA SARL
Formation créée le 21/10/2024. Dernière mise à jour le 13/02/2025.
Version du programme : 2
Programme de la formation
✅ Cette formation permet de préparer la certification : Créer et maintenir des solutions d’analyse de données efficaces et sécurisées sur le cloud AWS (RS6222) 👉 Plus d'informations : https://www.francecompetences.fr/recherche/rs/6222/ 📆 Date d'enregistrement de la certification: 25/01/2023 📆 Date d'échéance de l'enregistrement : 25/01/2026 Dans cette formation, vous apprendrez à construire des solutions d'analyse de données par lots à l'aide d'Amazon EMR, un service géré Apache Spark et Apache Hadoop de niveau entreprise. Vous apprendrez comment Amazon EMR s'intègre aux projets open source tels que Apache Hive, Hue et HBase, et avec les services AWS tels que AWS Glue et AWS Lake Formation. Cette formation aborde les composants de collecte, d'ingestion, de catalogage, de stockage et de traitement des données dans le contexte de Spark et d'Apache Hadoop. Vous apprendrez à utiliser les EMR Notebooks pour prendre en charge les charges de travail d'analyse et d'apprentissage automatique. Vous apprendrez également à appliquer les meilleures pratiques en matière de sécurité, de performance et de gestion des coûts au fonctionnement d'Amazon EMR. Cette formation est l'une des (multiples) étapes privilégiées préparant à la Certification "AWS Certified Data Analytics - Specialty". L'intégralité des étapes visant à obtenir la Certification "AWS Certified Data Analytics - Specialty" est disponible dans ce guide : https://d1.awsstatic.com/training-and-certification/ramp-up_guides/Ramp-Up_Guide_Data_Analytics.pdf
Objectifs de la formation
- Concevoir, créer, sécuriser et gérer des solutions analytiques avec les services AWS.
- Utiliser les services d’analytique des données AWS appropries pour chaque situation et orchestrer leur intégration les uns aux autres.
- Gérer les cycles de vie de la collecte, du stockage, du traitement et de la visualisation des données.
Profil des bénéficiaires
- Data Analyst
- Data Scientist
- Chief Data Officer
- Architecte Big Data
- Ingénieur Big Data
- Data Miner
- Machine Learning Engineer
- Business Intelligence Manager
- Il est recommandé au candidat cible d’avoir cinq ans d'expérience dans les technologies courantes d'analytique des données et deux ans d'expérience pratique et d'expertise dans l'utilisation des services AWS pour concevoir, créer, sécuriser et gérer des solutions analytiques
Contenu de la formation
-
MODULE A : VUE D'ENSEMBLE DE L'ANALYSE DES DONNÉES ET DU PIPELINE DE DONNÉES
- Cas d'utilisation de l'analyse des données
- Utilisation du pipeline de données pour l'analyse
-
MODULE 1 : INTRODUCTION À AMAZON EMR
- Utilisation d'Amazon EMR dans les solutions analytiques
- Architecture du cluster Amazon EMR
- Démonstration interactive : Lancement d'un cluster Amazon EMR
- Stratégies de gestion des coûts
-
MODULE 2 : PIPELINE D'ANALYSE DE DONNÉES À L'AIDE D'AMAZON EMR : INGESTION ET STOCKAGE
- Optimisation du stockage avec Amazon EMR
- Techniques d'ingestion de données
-
MODULE 3 : ANALYSE DE DONNÉES PAR LOTS HAUTE PERFORMANCE AVEC APACHE SPARK SUR AMAZON EMR
- Cas d'utilisation d'Apache Spark sur Amazon EMR
- Pourquoi Apache Spark sur Amazon EMR ?
- Concepts Spark
- Démonstration interactive : Connexion à un cluster EMR et exécution de commandes Scala à l'aide du Spark shell
- Transformation, traitement et analyse
- Utilisation de carnets de notes avec Amazon EMR
- Laboratoire pratique : Analysez les données à faible latence en utilisant Apache Spark sur Amazon EMR
-
MODULE 4 : TRAITEMENT ET ANALYSE DE DONNÉES PAR LOTS AVEC AMAZON EMR ET APACHE HIVE
- Utilisation d'Amazon EMR avec Hive pour traiter les données par lots
- Transformation, traitement et analyse
- Laboratoire pratique : Traitez des données par lots avec Amazon EMR et Hive
- Introduction à Apache HBase sur Amazon EMR
-
MODULE 5 : TRAITEMENT DES DONNÉES SERVERLESS
- Traitement, transformation et analyse de données Serverless
- Utilisation d'AWS Glue avec les charges de travail Amazon EMR
- Travaux pratiques 3 : Orchestrer le traitement des données dans Spark à l'aide d'AWS Step Functions
-
MODULE 6 : SÉCURITÉ ET SURVEILLANCE DES CLUSTERS AMAZON EMR
- Sécurisation des clusters EMR
- Démonstration interactive : Chiffrement côté client avec EMRFS
- Surveillance et dépannage des clusters Amazon EMR
- Démonstration : Examen de l'historique d'un cluster Apache Spark
-
MODULE 7 : CONCEVOIR DES SOLUTIONS D'ANALYSE DE DONNÉES PAR LOTS
- Cas d'utilisation de l'analyse de données par lots
- Activité : Concevoir un flux de travail d'analyse de données par lots
-
MODULE B : DÉVELOPPER DES ARCHITECTURES DE DONNÉES MODERNES SUR AWS
- Architectures de données modernes
Cette action de formation sera dispensée par un instructeur certifié par AWS. Nos instructeurs AWS officiels (AWS Authorized Instructor) sont hautement qualifiés et possèdent une connaissance approfondie des services AWS. Pour plus d'informations, cliquez ici : https://aws.amazon.com/fr/training/aai/
- Questionnaires à choix multiple (QCM)
- Laboratoires pratiques
- Cette formation comprend des présentations, des démonstrations interactives, des laboratoires pratiques, des discussions et des exercices en classe.
Qualité et satisfaction
Modalités de certification
- L'examen AWS Certified Data Analytics - Specialty est un examen éliminatoire. L'examen est évalué en fonction d'une norme minimale établie par les professionnels AWS. Ceux-ci observent les bonnes pratiques et directives en matière de certification. Les résultats à l'examen sont présentés sous la forme d'un score gradué de 100 à 1 000. Le score minimal pour réussir est de 750. Le score indique la performance du candidat lors de l'examen dans son ensemble. Les modèles de notation graduée permettent de mettre sur le même pied les scores de différents formulaires d'examen qui peuvent présenter des niveaux de difficulté légèrement différents.
- L'obtention de la certification se fait par passage d'un examen soit en centre certifié soit en ligne sur les plateformes Pearson VUE ou PSI. L’examen est surveillé et dure environ 3 heures. Il est composé de deux types de questions : des questions à choix multiples (une seule bonne réponse) et des questions a réponses multiples (plusieurs bonnes réponses).
- Le compte-rendu de score peut contenir un tableau des classifications des performances à chaque niveau de section. Ces informations sont destinées à fournir un feedback général sur les performances à l'examen.