Parlons un peu des possibilités de l’apprentissage automatique (Machine Learning vs. BI)

Comme vous le savez déjà, les #BigData sont dignes d’intérêts pour quiconque souhaite tirer des tendances dans les données. Une discipline qui s’attache à cette tâche est l’aide à la décision ou BI (Business Intelligence).

« D'ailleurs nous devrions plus parler de "Machine Learning" que de Big Data. »

Bernard Ourghanlian, Directeur technique Microsoft France

Dans ce contexte, ce billet s’intéresse à l’intégration de l’apprentissage automatique (Machine Learning) dans une étude BI, et propose dans ce cadre un aperçu de quelques réalisations possibles en Machine Learning, ainsi que la valeur apportée par ce domaine.

De prochains billets nous donnerons l’occasion d’aborder tout cela dans le détail, et ce de façon complémentaire à ce que nous avons déjà abordé dans ce blog sur le Machine Learning. Cela nous permettra en particulier de souligner le fait que la valeur des Big Data réside dans le fait de pouvoir appliquer des méthodes de Machine Learning.

Machine Learning et BI, un mariage impossible ?

Reprenons le schéma du cycle de vie de la donnée comme proposé dans un précédent billet.

clip_image002

Le Machine Learning intervient dans la partie ‘Analyser’ du cycle de vie de la donnée. Il intervient en complément du BI afin de procéder à une analyse plus poussée des données.

  • L’approche BI consiste à créer des agrégats des données pertinents (ou cubes) afin d’optimiser le temps de requête sur ces données
  • L’approche Machine Learning se sert quant à elle des données extraites et procède à une analyse sur celles-ci. Elle peut être réalisée par le module SSAS (SQL Server Analysis Services) de la plateforme de données SQL Server.

Data Mining et Machine Learning, s’agit alors de la même chose ?

On emploie beaucoup de termes pour désigner des concepts similaires : Data Mining, Analytics et Machine Learning.

Le Data Mining est la discipline qui s’attache à tirer de l’information des données. Les Analytics sont des outils qui permettent de faire dans la pratique du Data Mining.

Le terme Machine Learning (ou apprentissage automatique) désigne une branche de l’intelligence artificielle, qui tente de créer une forme d’intelligence à partir de données.

Ces 3 termes sont similaires dans notre contexte. Nous garderons cependant le terme Machine Learning, rappelant souvent des méthodes plus avancées et plus dans l’ère du temps.

Abordons à présent quelques exemples possibles d’application en Machine Learning.

Un exemple d’application : l’analyse de sentiment sur réseaux sociaux

De nombreuses informations sont disponibles sur les réseaux sociaux, et plus particulièrement sur Twitter où toutes ces données sont publiques. Il s’avère dès lors possible de s’intéresser par exemple à l’analyse du sentiment à l’image de ce que propose Sentiment140.

Dans la pratique, l’analyse du sentiment sur Twitter consiste à extraire un grand nombre de tweets contenant certains mots clé, et à déterminer lesquels sont positifs et lesquels sont négatifs.

Les résultats peuvent être visualisés de la manière suivante au sein de Power View dans Microsoft Excel :

clip_image004

Au-delà de l’intérêt que l’on peut porter à ce type d’application, ceci ne représente qu’un domaine parmi bien d’autres…

Et bien d’autres possibilités offertes par le Machine Learning

De façon à illustrer le champ des possibles, voici une liste non exhaustive de ce qui est réalisable à l’aide de Machine Learning :

clip_image006

Nous vous recommandons à ce titre la lecture des liens suivants qui présentent des applications innovantes en Machine Learning :

Nous espérons avoir éveillé vos curiosité et intérêts aux vues des possibilités en Machine Learning. Si vous souhaitez maintenant comprendre comment les principes de fonctionnent de ces méthodes et les appliquer, nous vous donnons rendez-vous dans les prochains billets de ce blog :)