Envie de vous former et/ou d’investir sur Azure HDInsight ?

Ce billet est la reprise en français du billet Azure HDInsight training resources – Learn about big data using open source technologies de Bhanu Prakash publié du blog Microsoft Azure. Il nous semblait en effet important de partager cette synthèse des ressources disponibles sur le service Azure HD Insight.

Bonne lecture

 

Azure HDInsight est une offre de service cloud Hadoop et Spark qui vous permet de mettre en place des clusters d'analyse open source optimisés pour Spark, Hive, MapReduce, HBase, Storm, Kafka et Microsoft R Server garantis par un SLA de 99.9%

Nous avons reçu de nombreuses demandes quant à la disponibilité d'un guide détaillé sur HDInsight. Ce billet expose ainsi les grandes lignes de ce guide avec quelques autres conseils et ressources sur l'apprentissage du service HDInsight.

Guide du développeur HDInsight

Nous avons reçu de nombreuses demandes de clients pour disposer d'une documentation détaillée sur HDInsight afin de concevoir, déployer, gérer, surveiller et sécuriser des solutions de mégadonnées (Big Data) dans des cas d'usage et scénarios impliquant de l'analyse avancée de données, du décisionnel (Business Intelligence ou BI), de l'ETL (Extract Transform Load), et bien d'autres.

En bref, nombreux sont les clients à la recherche d'un guide détaillant en pas-à-pas les étapes pour déployer et opérer au quotidien une solution Big Data. Nous sommes heureux de vous annoncer la disponibilité du guide du développeur HDInsight, un guide qui couvre les scénarios de base tout comme les scénarios avancés qui peuvent s'avérer utile pour tout développeur, scientifique de la donnée (data scientist) ou ingénieur de la donnée (data engineer) souhaitant démarrer sur le sujet ou approfondir leurs connaissances sur Azure HDInsight. Ce guide commence par une vue d'ensemble d'HD Insight et des cas d'utilisation, suivis de bonnes pratiques sur la configuration de cluster, la planification de la capacité, et le développement d'applications pour différentes charges de travail ( workload ) comme Hive, Spark, et l'optimisation de celles-ci. Le guide conclut enfin sur des cas d'usage et des scénarios avancés accompagnés d'exemples.

Table des matières du Guide du développeur HDInsight

Vous trouverez ci-après une version courte de la table des matières. Cela peut vous donner une bonne idée de ce que vous pouvez attendre de ce guide (en anglais) :

  • Vue d'ensemble
  • Architecture Hadoop et Azure HDInsight
    • Configurer le cluster
    • Configurer les identités et les contrôles d'accès
    • Surveiller et gérer le cluster HDInsight
  • Développer des applications Hive
  • Développer des applications Spark
    • Utiliser Spark avec les blocs-notes
    • Utiliser Spark avec IntelliJ
    • Exemples avec Spark
  • Développer des applications Spark ML
  • Deep Learning avec Spark
  • Développer des scripts R sur HDInsight
  • Développer des applications Spark Streaming
  • Optimiser Spark Performance
  • Utiliser HBase
    • Utiliser Phoenix avec HBase sur HDInsight
  • L'écosystème Open Source Apache
  • Scénarios avancés et approfondissements
  • Résolution de problèmes

Ressources de formation HDInsight

En complément de ce guide, nous tenons également à souligner les autres ressources disponibles pour monter en compétences ou approfondir ses connaissances sur HDInsight. Vous trouverez ainsi ci-après les différentes ressources de formation disponibles pour HDInsight ; ce qui comprend de l'auto-formation en ligne, de la documentation, des vidéos, etc.

Auto-formation en ligne

  • Auto-formation sur edX, une plateforme de formation en ligne, qui offre des contenus de qualité provenant des meilleures universités et institutions du monde. Les formations listées ci-dessous sont disponibles à travers le programme Microsoft Professional Program for Big Data accessible gratuitement ou avec l'ajout d'un certificat vérifié pour un coût additionnel.
    • Processing Big Data in Azure HDInsight (en anglais) : ce cours vous montre comment utiliser les technologies Hadoop dans Microsoft Azure HDInsight pour concevoir des solutions de traitement par lots qui purifie et remanie vos données pour de futures analyses.
    • Implementing Real Time Analytics in Azure HDInsight (en anglais) : Dans ce cours, vous apprendrez comment implémenter des solutions de mégadonnées de streaming et à faible latence en utilisant des technologies Hadoop comme HBase, Storm et Spark sur Microsoft Azure HDInsight.
    • Implementing Predictive Analytics in Azure HDInsight (en anglais) : Dans ce cours, vous apprendrez comment implémenter des solutions d'analyse prédictive pour les mégadonnées à l'aide d'Apache Spark dans Microsoft Azure HDInsight
  • Des formations en ligne gratuites sur Microsoft Virtual Academy, qui vous donnent accès à des contenus issus d'experts reconnus mondialement pour vous aider à développer vos compétences techniques et à avancer dans votre carrière. Prêt(e) pour continuer votre plongée dans les mégadonnées ? Ci-dessous, vous trouverez des cours pour explorer les possibilités d'Hadoop et de Spark sur HDInsight, des parties essentielles pour la partie Analytique de la série « MVA Data Series ».

Documentation

  • Documentation HDInsight : page d'accueil de la documentation HDInsight à destination de tout développeur, scientifique de la données ou administrateur de solutions de mégadonnées. Cette documentation forte de plus de 1385 pages intègre toutes les sections du traditionnel « Démarrer avec » aux sujets spécifiques sur des cas d'usage et des scénarios avancés avec HDInsight. Vous pouvez télécharger l'intégralité de cette documentation à l'aide de l'option « Télécharger comme PDF » située dans le coin inférieur gauche de la page ou rechercher des articles donnés avec le champ de recherche situé en haut à gauche.
  • Guide de dépannage d'HDInsight (en anglais) : Microsoft met constamment à jour de guide de dépannage pour que vous puissiez (plus) facilement déboguer ou diagnostiquer les problèmes que vous pouvez rencontrer.

Vidéos

Les vidéos suivantes constituent un bon point de départ pour disposer d'un aperçu du périmètre et des fonctionnalités d'HDInsight :

Webcasts à la demande de conférences 2016-17 (en anglais)

Ignite

Strata

Hadoop Summit

//build

Ateliers pratiques (hands on labs)

  • Atelier Science de la donnée (en anglais) : cet atelier illustre spécifiquement sur le composant Spark ML dans Spark et mets l'accent sur sa proposition de valeur au sein du Framework de traitement de mégadonnées Apache Spark.
  • Atelier Hive (en anglais) : cet atelier illustre comment vous pouvez tirer profit d'HDInsight Hive pour analyser des mégadonnées stockées dans Azure Blob Storage.

Acquérir une certification Microsoft sur HDInsight

Ressources

 

Nous espérons que vous trouverez le guide du développeur et l'ensemble de ces autres ressources utiles. Si vous avez des questions ou des retours d'expérience, n'hésitez pas à envoyer un courriel à l'adresse hdiask@microsoft.com (en anglais).

 

Ceci conclut la reprise de ce billet de ressources. Nous vous souhaitons une bonne lecture ou un bon visionnage de ces différentes ressources sur Azure HDInsight en espérant que ceci vous aide dans votre quotidien.