Objectifs de la formation
Dans le cadre de ce cours, vous découvrirez comment utiliser Amazon EMR afin de traiter des données grâce à l'écosystème Hadoop. Vous apprendrez également à créer des environnements de Big Data, à utiliser Amazon DynamoDB, Amazon Redshift et Amazon Kinesis, Amazon QuickSight, Amazon Athena et à appliquer au mieux les bonnes pratiques afin de concevoir des environnements de Big Data sécurisés et économiques.Clientèle visée
Personnes en charge de la conception et de l'implémentation de solutions de Big Data, comme les architectes de solutions ainsi que les analystes de données souhaitant découvrir les solutions de Big Data sur AWS.Préalables
• Avoir des connaissances de base sur les technologies Big Data, notamment Apache Hadoop et HDFS Pig, Hive et MapReduce.
• Savoir utiliser les principaux services AWS et l'implémentation de cloud public.
• Les participants doivent avoir suivi le cours "Notions de base AWS" ou posséder un niveau d'expérience équivalent.
• La compréhension des concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base données est recommandée.
Formateurs
Gains pour les participants
Comprendre les applications Apache Hadoop dans le contexte d’Amazon EMR
Identifier les composants d’un cluster Amazon EMR
Lancer et configurer un cluster Amazon EMR
Utiliser les frameworks de programmation courante disponibles pour Amazon EMR notamment Hive, Pig and Streaming
Utiliser Hue pour améliorer la facilité d’utilisation de Amazon EMR
Utiliser les analyses en mémoire avec Spark sur Amazon EMR
Identifier les avantages de l’utilisation de Amazon Kinesis pour les processus Big Data proches du temps réel
Utiliser Amazon Redshift pour stocker et analyser efficacement les données
Comprendre et gérer les coûts et la sécurité d’une solution Big Data
Sécuriser une solution Big Data
Identifier les options pour récupérer, transférer et compresser des données
Comprendre Amazon Athena pour les analyses de requêtes ad-hoc
Utiliser le logiciel de visualisation pour représenter les données et les requêtes via Amazon QuickSight
Orchestrer le flux de la Big Data via AWS Data Pipeline.
Architecture de la formation
Introduction à la Big Data sur AWS
Vue d’ensemble de la Big data
Récupérer et transférer la Big Data
Streaming Big Data et Amazon Kinesis
Solutions de stockage Big Data
Process Big Data et Analyse
L'écosystème Hadoop
Apache Hadoop et Amazon EMR
Utiliser Amazon EMR
Frameworks de programmation Hadoop
Inetrfaces Web sur Amazon EMR
Apache Spark sur Amazon EMR
Big Data et AWS
Amazon Redshift et Big Data
Visualiser et Orchestrer la Big Data
Gérer les coûts de la Big Data
Sécuriser les déploiements de votre Amazon
Modèles de conception Big Data.
Détails pédagogiques
Type de cours
Formation privée en entreprise
Vous êtes plusieurs à vouloir suivre une formation en particulier dans votre entreprise? Si vous êtes plus de 8 personnes, nous pouvons nous déplacer à vos bureaux pour vous donner votre formation en privé. Contactez-nous pour plus de détails ou demandez-nous une soumission en ligne.
Demander une soumissionFormation privée en entreprise
Vous êtes plusieurs à vouloir suivre une formation en particulier dans votre entreprise? Si vous êtes plus de 8 personnes, nous pouvons nous déplacer à vos bureaux pour vous donner votre formation en privé. Contactez-nous pour plus de détails ou demandez-nous une soumission en ligne.
Demander une soumission