Bien démarrer avec les solutions Microsoft pour le Big Data

Le billet précédent vous proposait d’approfondir le développement de solutions Big Data dans le Cloud à l’aide de Windows Azure HDInsight et des technologies associées au travers (de la pré-version) d’un guide complet couvrant HDInsight et les différents projets de l’écosystème Hadoop bien sûr, le SDK Microsoft .NET pour Hadoop, mais aussi StreamInsight, SQL Server Reporting Services, SQL Services Analysis Services, Excel, etc.

Nous continuons avec ce billet dans les contenus didactiques disponibles pour bien démarrer avec Windows Azure HDInsight et souhaitons mettre en avant la série Démarrer avec Microsoft Big Data de 5 webcasts d’une heure disponible en ligne sur la chaîne Channel 9 de MSDN :

  • Module 01 : Une introduction au Big Data. Ce module vous propose une vue d’ensemble des investissements de Microsoft dans le Big Data et présente comment utiliser l'architecture Big Data Lambda pour décrire des solutions. Vous apprendrez notamment comment configurer un cluster Windows Azure HDInsight avec le stockage utilisé dans les autres modules de cette série.
  • Module 02 : Une introduction à Map/Reduce. Ce module aborde les principes fondamentaux de Map/Reduce avec Hadoop, décrit comment créer un job Map/Reduce à l’aide de C# pour traiter les données, puis comment l’exécuter sur un cluster HDInsight.
  • Module 03 : Une introduction à Hive et HiveQL. Ce module montre comment exploiter vos compétences SQL à l'aide de Hive et de HiveQL pour créer des tables et des vues, et exécuter des requêtes sur les données Hadoop à l'aide d'un cluster de HDInsight.
  • Module 04 : Développer des applications Big Data avec .NET. Ce module présente comment utiliser le langage LINQ (Language Integrated Query) .NET pour créer des requêtes Hive sur les données Hadoop. Il traite également de la création d’applications de données en continu avec les Reactive Extensions du .NET Framework.
  • Module 05 : Mettre en œuvre votre pipeline Big Data. Ce dernier module illustre comment utiliser le SDK Microsoft .NET pour Hadoop afin de réaliser des tâches basées sur Hadoop. Vous apprendrez comment automatiser la création de cluster, exécuter un job Map/Reduce et supprimer un cluster à l'aide de Windows PowerShell.

Si nous avons déjà traité abondement ces thématiques sur ce blog, ceci n’en demeure pas moins une bonne occasion de disposer d’une présentation synthétique sur le sujet.

Bon visionnage !