Le Machine Learning avec Spark grâce à HDInsight – 2nde partie

Dans la première partie de ce billet, nous avons vu comment déployer un cluster Apache Spark sur Azure HDInsight. Ce billet s’intéresse sur cette base à l’étudie d’un exemple d’application d’apprentissage automatique (Machine Learning). Ce sera alors l’occasion de découvrir les principales commandes d’Apache Spark à travers PySpark, le Framework de programmation Spark en Python….


Le Machine Learning avec Spark grâce à HDInsight – 1ère partie

Cela faisait longtemps que nous n’avions pas eu l’occasion de partager sur ce blog. Pour autant, si vous êtes une fidèle lectrice ou un fidèle lecteur de ce blog depuis ses débuts, vous êtes sûrement déjà familier avec le service Azure HDInsight qui vous permet de disposer à la demande d’un cluster Hadoop et Spark…


Souhaitons la bienvenue au nouveau blog MSDN Machine Learning France ! :)

Depuis 2 ans, ce blog essaie de démystifier ce que l’on appelle aujourd’hui les Big Data ou déluge de données. Nous avons ainsi commencé par nous intéresser à Hadoop et à son écosystème, ce dernier étant reconnu comme étant l’un des plus aboutis et surtout le plus utilisé concernant le traitement de grands volumes de…


Souhaitons la bienvenue au nouveau blog MSDN Machine Learning France ! :)

Depuis 2 ans, ce blog essaie de démystifier ce que l’on appelle aujourd’hui les Big Data ou déluge de données. Nous avons ainsi commencé par nous intéresser à Hadoop et à son écosystème, ce dernier étant reconnu comme étant l’un des plus aboutis et surtout le plus utilisé concernant le traitement de grands volumes de…


Evaluer un modèle en apprentissage automatique

Dans ce billet et pour clore notre parcours sur l’apprentissage automatique (Machine Learning) et ses principes de fonctionnement, nous allons nous intéresser aux indicateurs qui permettent de mesurer la qualité d’un modèle. Ceci va nous amener à expliquer que calculer ces indicateurs ne s’avère pas toujours suffisant à cause du phénomène de sur-apprentissage. Nous brosserons…


Un peu de théorie pour l’apprentissage supervisé – 2nde partie

Après un regard sur l’apprentissage non-supervisé dans de précédents billets, la première partie de billet sur l’apprentissage supervisé s’est intéressée à la classification. Comme annoncé dans ce cadre, nous vous proposons à présent de détailler dans cette seconde partie quelques méthodes de régression. Nous rappelons qu’il est question de régression en apprentissage supervisé lorsque l’attribut…


Un peu de théorie pour l’apprentissage supervisé – 1ère partie

Nous poursuivons notre exploration de l’apprentissage automatique (Machine Learning) ; gageons que la disponibilité prochaine en juillet de la préversion publique d’Azure Machine Learning (Azure ML) nous donnera à n’en point douter l’occasion d’illustrer par la pratique tout cela. Pour résumer les épisodes ou plutôt les billets précédents, nous avons pu échanger sur les principes…


Bienvenue à Azure Machine Learning ! :)

Comme nous le relations il y a peu dans un précédent billet, notre nouveau PDG Satya Nadella a réaffirmé et précisé le 15 avril dernier la stratégie de Microsoft orientée vers la donnée lors de la conférence Accelerate your insights, (Si vous avez manqué l’évènement, n’hésitez pas à visionner les webcasts disponibles au niveau de…


Bienvenue à Azure Machine Learning ! :)

Comme nous le relations il y a peu dans un précédent billet, notre nouveau PDG Satya Nadella a réaffirmé et précisé le 15 avril dernier la stratégie de Microsoft orientée vers la donnée lors de la conférence Accelerate your insights, (Si vous avez manqué l’évènement, n’hésitez pas à visionner les webcasts disponibles au niveau de…


Un peu de théorie pour l’apprentissage non-supervisé

Nous avons appliqué dans le billet précédent des méthodes d’apprentissage non supervisé pour analyser des logs de proxy. Dans le cadre de ce billet, nous vous proposons à titre de complément de voir dans les détails comment fonctionnent ces algorithmes et ainsi les possibilités qu’ils offrent. L’apprentissage non-supervisé consiste à tirer de la valeur de…