Introducción a la búsqueda de SharePoint 2013

Artículo original publicado el sábado, 29 de septiembre de 2012

​Introducción breve:
Soy Gerhard Schobbe, Administrador de programas de grupo del equipo de SharePoint responsable de los escenarios de búsqueda de los trabajadores de la información en la empresa.

Objetivos de esta versión

Permitidme hablar en primer lugar de los objetivos de esta versión.

Al igual que ocurre al lanzar cualquier versión, teníamos en mente mejorar varias áreas. Fundamentalmente, tres de ellas relacionadas con Office 2013:

  • Cambiar a una única plataforma de búsqueda empresarial.
  • Ofrecer un avance significativo en cuanto a la interacción de los usuarios finales con el sistema de búsqueda.
  • Establecer esta plataforma como una capa más general de acceso a la información para las aplicaciones, incluidos otros elementos como SharePoint y, por supuesto, el desarrollo de componentes de terceros.

Describiré estos objetivos en mayor profundidad, con ejemplos para resaltar el progreso que hemos realizado en cada uno de ellos. A este artículo introductorio le seguirán otros análisis más detallados en segundo plano por los distintos subsistemas, a lo largo de las próximas semanas y meses.

Plataforma de búsqueda única

En primer lugar, nos detendremos en el objetivo de conseguir una única plataforma de búsqueda empresarial. Con la adquisición de FAST a mediados de 2008 y la versión subsiguiente de Office 2010, la línea de productos de Microsoft SharePoint 2010 incluye una oferta de búsqueda en dos niveles, cada uno de ellos basado en distintas pilas tecnológicas: SharePoint 2010 incluye un sistema de búsqueda empresarial a partir de un código base desarrollado en Redmond, mientras que el nivel superior incluye FAST Search Server 2010, un sistema desarrollado a partir de la pila tecnológica de FAST como consecuencia de la adquisición.

En cualquier caso, teníamos claro que un sistema podía combinar lo mejor de ambas implementaciones para ofrecer un producto de búsqueda empresarial global y, al mismo tiempo, simplificar las opciones de nuestros clientes: una situación en la que todos ganan. Y, más allá, el proceso de rediseñar la arquitectura global también nos permitía integrar varios componentes modernos en los que FAST había estado trabajando y que todavía no habían salido al mercado, incluidos los marcos de procesamiento de consultas y contenido actualizado.

El resultado de este plan tras varios años de trabajo de ingeniería es un sistema que combina el ya conocido marco de rastreador (crawler) y conector de la búsqueda de SharePoint, con los marcos de procesamiento de consultas y contenido de próxima generación de FAST, todo ello junto con un núcleo de búsqueda basado en FAST Search.

De nuevo, las experiencias del usuario predeterminadas para los usuarios finales y los administradores de TI se hospedan en SharePoint, donde la experiencia del usuario final se ha reformulado totalmente desde un enfoque de representación basada en el servidor de 2010, hasta una perspectiva asincrónica del cliente (completaremos esta información más adelante).

Asimismo, conseguimos integrar un nuevo motor de análisis que actúa como runtime para trabajos diversos, entre los que se incluye la clasificación de algoritmos y recomendaciones.
 
Debo mencionar que se ha realizado un gran trabajo para hospedar la plataforma de búsqueda en la nube y reforzar el servicio de O365 para cuando se presente la próxima versión en línea.
 
En la imagen siguiente puede ver un resumen gráfico de este proceso (haga clic en ella para ampliarla).

 

 

Crear una experiencia del usuario innovadora

 

 

Llegamos en este punto a la segunda área de inversión: ofrecer mejoras novedosas para todos los usuarios finales. Tradicionalmente, un usuario podía introducir un conjunto de términos de búsqueda en la página principal del Centro de búsqueda que podían interpretarse como palabras clave, y los resultados consistían en una única lista clasificada de vínculos con tres resúmenes de línea y algunos metadatos. Describiré cómo avanzamos al siguiente nivel en cada caso.

 

La página principal del Centro de búsqueda es el punto de entrada principal:

 

En esta versión, todos los cuadros de búsqueda de los distintos sitios de grupo ofrecen acceso total a la búsqueda global de la empresa, de personas y a otras experiencias de búsqueda especializada, además de al ámbito tradicional de búsqueda en los sitios. Los usuarios pueden obtener acceso al ámbito que desean desde la lista desplegable que contiene cada cuadro de búsqueda.

De este modo, la experiencia de búsqueda en el nivel de empresa se encuentra totalmente accesible para cualquier usuario que trabaje en un sitio de grupo o en uno de los diversos concentradores de SharePoint. 

Todos los términos se consideran palabras clave:

Al analizar de forma detallada varios registros autorizados de consultas de clientes, observamos claramente que muchas consultas de los usuarios consistían en una combinación de palabras clave y de palabras de comando, donde estas últimas especificaban el tipo de resultado que el usuario buscaba. Detectamos otro gran grupo de consultas que podríamos llamar de navegación, en el sentido de que se esperaba como resultado una ubicación que podía encontrarse en un sitio de grupo, un sitio web de otro tipo, una biblioteca de documentos o incluso un documento particular que el usuario ya había usado en ocasiones anteriores.

 

Para profundizar en el concepto de las palabras de comando, veamos el ejemplo de "portfolio de marketing ". Está claro (con una interpretación humana) que el usuario busca una presentación de marketing, pero ninguna de las presentaciones contiene la palabra "portfolio", que simplemente forma parte de la terminología común. Tiene mucho más sentido clasificar los términos de la consulta en palabras clave reales ("marketing" en este caso) y palabras de comando que se transformarán en restricciones de la consulta (en este caso, una restricción del tipo que limita el tipo de resultado a todos los tipos de archivo que se hayan definido como presentaciones). Por ejemplo, se puede aplicar esta misma idea a las sugerencias que busca el usuario para un sitio o a las búsquedas específicas de documentos que no son páginas web. Con esta idea en mente, decidimos incorporar las reglas de consulta, un sistema generalizado y extensible de análisis de consultas que asigna los términos de una consulta a palabras clave, y permite transformar las palabras de comando en consultas de propiedades. Las reglas de consulta también ofrecen capacidades más avanzadas como la posibilidad de crear bloques de resultados a partir del comportamiento del usuario. En futuras entradas de blog analizaremos de forma más detallada todas las posibilidades de las reglas de consulta.

Una única lista de resultados clasificada:

 

Las reglas de consulta permiten interpretar una misma consulta de maneras diferentes. Una interpretación puede centrarse en una restricción del tipo, como en el ejemplo anterior, y ofrecer un conjunto de documentos. Otra regla puede desencadenar un proceso que considere "marketing" como una disciplina definida de un diccionario de categorías de trabajo de una compañía como Microsoft, y devolver un conjunto de resultados específicos del ámbito del repositorio de RR. HH. corporativo, con contenido moderado cuidadosamente para cada disciplina. Y probablemente tenga más sentido pensar que ambas interpretaciones son incorrectas, y que la consulta tradicional de palabras clave del índice tiene más probabilidades de obtener los resultados que el usuario está buscando realmente. Si se combinan estos tres conjuntos de resultados en una única página, alcanzamos el concepto de bloques de resultados. Estos bloques aumentan la lista única clasificada de resultados individuales con un conjunto clasificado de bloques que se insertan en ubicaciones distintas, cada uno de ellos con resultados clasificados de forma individual.

Al igual que ocurría anteriormente, se precisa una explicación mucho más detallada de esta área para poder mostrar la eficacia real de todos los conceptos subyacentes.

La captura de pantalla siguiente muestra un ejemplo: la página de resultados de la consulta "portfolio de marketing" incluye un bloque con los "portfolios" (las presentaciones) que coinciden con la consulta "marketing". También aparecen los resultados habituales de la consulta completa.

 

Vínculos con tres resúmenes de línea:

 

Teníamos claro que intentar agregar más información al mismo espacio de píxeles disponible en pantalla no iba a mejorar realmente la capacidad del usuario para examinar los resultados rápidamente y encontrar la información que necesita. La solución consistió en un panel activable que se puede ampliar para mostrar visualmente las vistas previas de sitios, documentos y conversaciones. Asimismo, este panel permite pasar de una experiencia diseñada implícitamente como un proceso unidireccional de lectura de documentos o páginas web, a un conjunto de acciones extensible que los usuarios pueden realizar con los resultados de la búsqueda. Por ejemplo, seguir un documento, pasar al modo Edición, o compartir o abrir la biblioteca donde se encuentra almacenado un documento para ver el contenido adicional del que dispone. Y estas son solo algunas de las posibilidades.

Por último pero no menos importante, en lugar de sugerir únicamente resúmenes de texto, se permite la extracción de secciones semánticas de varios tipos de documentos, que se ofrecen en el panel activable como "vínculos profundos" realmente eficaces (porque es muy probable que el Moderador haya pensado cuidadosamente los títulos de las diapositivas de una presentación de PowerPoint para que resuman el contenido de cada diapositiva, aunque el nombre de archivo no resulte especialmente descriptivo).

Ahora se extraen y se muestran los títulos de las diapositivas que responden a las palabras clave, lo que permite al usuario centrarse, en una consulta de 100 millones de elementos realizada en el índice, en una única diapositiva con un título relevante, y abrir la presentación exactamente por esa diapositiva con un solo clic. Esta característica también se encuentra disponible para los documentos de Word y Excel (con los gráficos y las tablas con nombre que contienen), y para los sitios de SharePoint (con las bibliotecas de documentos y los subsitios principales).
 
También se ha rediseñado el marco de interfaz de usuario compatible con todas estas nuevas características y ahora se basa en un conjunto de plantillas de diseño anidadas que se definen en JavaScript y HTML para obtener una extensibilidad mucho más sencilla. Todos los tipos de resultados cuentan con una plantilla para controlar el diseño de la lista de resultados, y con una plantilla de panel activable. Los diseños de los bloques se controlan con una plantilla independiente y, a continuación, se define el diseño de todos los resultados con una plantilla de grupo, todas ellas adaptables al diseño de presentación que se desee. Puede servir de ejemplo la búsqueda de vídeo que se incluye de forma predeterminada, y usa un diseño de cuadrícula con diseños de resultados personalizados para presentar los distintos resultados de vídeo. Una apariencia bastante distinta que se ha conseguido simplemente al cambiar una plantilla, sin necesidad de realizar cambios en el código base del elemento web necesario para los resultados.

Juntas, todas estas mejoras conforman una experiencia del usuario enormemente eficaz, de gran capacidad de respuesta y a la que se puede obtener acceso desde cualquier ubicación de SharePoint, que comprende las consultas del usuario mucho mejor y ofrece resultados de forma muy visual, con acceso directo a la mayoría de la información pormenorizada interna de sitios y documentos, y que permite a los usuarios interactuar con los resultados sin necesidad de salir de la página de resultados.

La imagen siguiente muestra un ejemplo de esta experiencia para una presentación de PowerPoint: vínculos a los títulos de diapositivas relevantes de un archivo, una vista previa que permite al usuario desplazarse entre las páginas de la presentación de forma interactiva y un conjunto de vínculos de acciones en la parte inferior del panel.



Realizar búsquedas como una plataforma de acceso a la información

El tercer objetivo ha sido establecer la plataforma de búsqueda como una plataforma de acceso a la información más generalizado.
Un índice de búsqueda empresarial correctamente configurado constituye una colección impresionante de la información disponible en una empresa, que cruza los silos de información de diferentes sistemas de administración de documentos y normaliza a través de ellos el esquema de metadatos.

Sería fantástico exponer toda esta información como una experiencia del usuario interactiva basada en palabras clave. Pero, ¿por qué detenerse en este punto? Son muchísimas las experiencias de información que podrían beneficiarse de una vista centrada en el usuario que traspasa los límites de los silos subyacentes, y aprovecha la clasificación y la coincidencia de contenidos basada en palabras clave para mostrar, en primer lugar, los términos más apropiados.

Para mostrar realmente lo que esto significa, me gustaría destacar algunos de los ejemplos que incluye SharePoint 2013 de forma predeterminada:

  • En Mis sitios, los usuarios pueden obtener acceso a una lista con todas las tareas de SharePoint que tienen asignadas, independientemente de en qué sitios se encuentren almacenadas estas asignaciones.
  • Ahora, todas las bibliotecas de documentos disponen de un cuadro de búsqueda en la parte superior que permite a los usuarios realizar búsquedas en los metadatos y el texto completo de los documentos que contienen, y la lista de resultados se presenta como una vista estándar de SharePoint, y no como una página de resultados.
  • Si se hace clic en una etiqueta hash de un artículo o una discusión, aparece una lista con todas las conversaciones que se han mantenido en la empresa sobre ese tema.

Esta versión incorpora otras muchas características realmente interesantes, como un nuevo sistema para definir los tipos basado en reglas (por ejemplo, un contrato que sea diferente del tipo genérico de archivo de Word), mejor relevancia adaptable desde la UI y a través de CLASIFICAX, eDiscovery para SharePoint y Exchange, rastreo continuo para mantener el contenido más actualizado, instalaciones para combinar resultados de arrendamientos de O365 y de implementaciones locales en configuraciones 'híbridas", API de RESTful y CSOM, y mucho, mucho más.

 

Esperamos que le haya interesado. Inicie sesión en el entorno en línea de vista previa de O365, o descargue los bits aquí y realice la instalación en una máquina local.

Coméntenos sus impresiones.
 
G.

Esta entrada de blog es una traducción. Puede consultar el artículo original en Overview of Search in SharePoint 2013.