Microsoft Cognitive Services

Continuando con la tendencia de dotar de inteligencia a los sistemas informáticos, se ha presentado durante el Build 2016 la evolución de lo que se conocía como Project Oxford, hoy renombrado a Microsoft Cognitive Services.

Consiste en poner a disposición del desarrollador un gran número de API’s para dotar de inteligencia a sus aplicaciones gracias a Machine Learning y a Deep Learning así como permitir realizar conversaciones naturales con el sistema. El número total de API’s asciende a 22, dando así la posibilidad de crear potentes aplicaciones inteligentes.

Se dividen en cinco grandes grupos:

Visión Vision

Contiene API’s para la interacción mediante la vista, como son:

  • Computer Vision API: obtiene información para procesarla mediante imágenes.
  • Emotion API: realiza una detección de las emociones del usuario y genera información al respecto.
  • Face API: gestiona la identificación y la información que se obtiene de las caras de la gente en las fotografías.
  • Video API: permite analizar, procesar y editar videos en tus aplicaciones.

Habla Speech

Contiene las API’s de reconocimiento de voz:

  • Custom Recognition Intelligent Service (CRIS) : Ajusta el reconocimiento de voz para todo tipo de usuarios.
  • Speaker Recognition API: permite a la aplicación saber quién está hablando.
  • Speech API: recoge la voz y la convierte a texto y viceversa.

Lenguaje Language

Contiene las API’s relativas al lenguaje del usuario:

  • Bing Spell Check API: Detecta y corrige errores del lenguaje en tus aplicaciones.
  • Language Understanding Intelligent Service (LUIS) : Crea modelos de lenguaje para poder entender ordenes que den los usuarios de la aplicación.
  • Linguistic Analysis API: Analiza el lenguaje a partir de texto para identificar conceptos y acciones o encontrar frases.
  • Text Analytics API: Analiza el texto para detectar todo tipo de sentimientos, palabras clave, temas o idiomas.
  • Web Language Model API: Procesa el lenguaje natural humano para realizar tareas concretas.

Conocimiento Knowledge

Contiene las API’s que profundizan en el contexto de la información y el conocimiento:

  • Academic Knowledge API: Da acceso a contenido académico como generación de gráficos o interprete del lenguaje.
  • Entity Linking Intelligence Service: Obtiene enlaces a datos mediante el reconocimiento de entidades en los textos.
  • Knowledge Exploration Service: Permite realizar consultas en bases de datos estructuradas mediante lenguaje natural.
  • Recommendations API: Realiza recomendaciones de productos para los clientes según sus preferencias.

Contiene las API’s de búsqueda de información:

  • Bing Autosuggest API: Da a tus aplicaciones la capacidad de sugerir opciones de búsqueda de información.
  • Bing Image Search API: Proporciona un buscador de imágenes e información detallada.
  • Bing News Search API: Permite buscar noticias y enlazarlas con tus aplicaciones.
  • Bing Video Search API: Permite buscar videos y obtener información detallada.
  • Bing Web Search API: Permite realizar búsquedas dentro de las aplicaciones.

Durante el Build 2016, hemos podido ver una demo realizada con un desarrollador invidente que utiliza unas gafas que llevan diferentes sensores y le permite conocer e interactuar con su entorno de una manera natural, facilitándole, por ejemplo, la lectura del menú de un restaurante, gracias a dichas gafas, que son capaces de leerla y comunicarle lo que está escrito. Todo ello hace uso de sistemas cognitivos que analizan los datos recogidos por los sensores y los interpretan gracias a los diferentes servicios.

build_8_web

 

Toda la documentación se encuentra disponible en la web de Microsoft Cognitive Service.

 

Rubén Asensio García

@butcher086

Intern Technical Evangelist