Visão Geral da Pesquisa no SharePoint 2013

Article
11/27/2012

Artigo original publicado no sábado, 29 de setembro de 2012

Rápida introdução:
Meu nome é Gerhard Schobbe, sou Gerente de Programa de Grupo da equipe na organização do SharePoint dedicada aos cenários de pesquisa relacionados às informações sobre funcionários da empresa.

Objetivos desse lançamento

Primeiro vou abordar os objetivos desse lançamento.

Com esse lançamento, desejamos melhorar várias áreas. Havia três prioridades para a nova versão do Office 2013:

Construir uma plataforma única de pesquisa coorporativa
Proporcionar um real avanço na maneira pela qual os usuários finais interagem com o sistema de pesquisa
Estabelecer essa plataforma como uma camada de acesso à informação universal para aplicativos, incluindo outras partes do SharePoint e, claro, desenvolvimentos de terceiros

Vou detalhar cada um destes e usar alguns exemplos para destacar o progresso que fizemos. Este post será seguido por uma série de publicações muito mais detalhadas sobre os bastidores dos vários subsistemas, já nas próximas semanas e meses.

Plataforma única de pesquisa

Primeiro, vamos dar uma olhada no objetivo de chegar a uma plataforma de pesquisa coorporativa. Com a aquisição do FAST, em meados de 2008 e o posterior lançamento do Office 2010, a linha de produtos do Microsoft SharePoint 2010 incluía uma oferta de pesquisa de duas camadas, onde as camadas eram baseadas em tecnologias diferentes. O SharePoint 2010 possui um sistema de pesquisa corporativa baseado em um código base desenvolvido em Redmond e a camada superior inclui o FAST Search Server 2010, um sistema desenvolvido com base na tecnologia FAST.

No entanto, também ficou claro que um sistema que pudesse combinar o melhor de ambas as implementações ofereceria um produto de pesquisa coorporativa superior em todos os aspectos ao simplificar as escolhas dos nossos clientes para que todos ganhem. Melhor ainda, o processo de repensar toda a arquitetura também ofereceu a oportunidade de integrar vários dos componentes modernos que estavam sendo desenvolvidos pelo FAST e ainda não haviam sido lançados, incluindo o conteúdo atualizado e as estruturas de processamento de consulta.

O resultado desse plano, depois de vários anos de trabalho de engenharia, foi um sistema que combina o rastreador e o Connector Framework familiar à Pesquisa do SharePoint com a próxima geração de estruturas de processamento de conteúdo e de processamento de consulta do FAST, todos funcionando em conjunto com um núcleo de pesquisa com base no FAST Search.

As experiências de usuário padrão dos consumidores finais e dos administradores de TI estão novamente hospedadas no SharePoint — onde a experiência do usuário final foi completamente renovada e passou de uma abordagem de renderização com base no servidor em 2010 a uma abordagem assíncrona de renderização do lado do cliente (falaremos mais sobre isso depois).

Além disso, fomos capazes de integrar um novo mecanismo de análise que serve como tempo de execução de uma variedade de trabalhos, incluindo algoritmos de classificação e recomendações.

Vale a pena mencionar que muito trabalho tem sido feito para fazer com que a plataforma de pesquisa esteja hospedada na nuvem. Ela reforçará o serviço O365 assim que a última versão estiver online.

A figura abaixo mostra um resumo gráfico (clique na imagem para ampliar).

Criar uma experiência de usuário revolucionária

Isso nos leva à segunda área de investimento, que proporciona melhorias inovadoras para todos os usuários finais. Tradicionalmente, o usuário deve inserir um conjunto de termos de busca em uma homepage de central de pesquisa que seria tratada como palavras-chave, e os resultados seriam uma lista de classificação única de links com três linhas de resumo e pequenos metadados. Vou mostrar agora como passamos ao próximo nível em cada caso.

Homepage do Centro de Pesquisa é o principal ponto de entrada:

Nessa versão, cada caixa de pesquisa em cada um dos sites de equipe oferecem total acesso à pesquisa em toda a empresa, à pesquisa de pessoal e outras experiências de pesquisa especializada, além da tradicional pesquisa no âmbito do site. Os usuários podem acessar o escopo desejado a partir da lista suspensa na caixa de pesquisa.

Isso coloca o poder das experiências de pesquisa de nível empresarial ao alcance de qualquer usuário que trabalhe em um site de equipe ou em um dos vários centros do SharePoint.

Cada termo é uma palavra-chave:

Uma análise detalhada dos vários logs de consulta do cliente, dos quais obtivemos permissões, demonstrou claramente que as consultas de muitos usuários são uma mistura de palavras-chave e palavras de comando, em que estas possam indicar o tipo de resultado que o usuário está procurando. Outras também representativas são as consultas de navegação no sentido em que os resultados esperados eram um local, seja um site de equipe, outro site qualquer, uma biblioteca de documentação ou mesmo um determinado documento que o usuário já tenha utilizado algumas vezes.

Para ampliar o conceito de palavras de comando, vamos olhar para o exemplo da "plataforma de marketing". O usuário está visivelmente (aos olhos humanos) à procura de uma apresentação sobre marketing, mas nenhuma das apresentações terá a palavra "plataforma", que vem a ser um jargão. Faz muito mais sentido classificar os termos de pesquisa em palavras-chave reais ("marketing", neste caso) e palavras de comando que precisam ser mais específicas para a consulta, neste caso, uma restrição que limite o tipo de resultado em todos os tipos de arquivos definidos como apresentações. A mesma ideia se aplica, por exemplo, aos indícios de que o usuário esteja procurando um site ou documentos específicos que não sejam paginas da web. Este processo de desenvolvimento levou à introdução das Regras de Consulta, um sistema generalizado, extensível para análise de consulta que mapeia os termos de uma consulta em palavras-chave e permite a transformação das palavras de comando em consultas de propriedades. As Regras de Consulta também têm capacidades mais avançadas, incluindo o aproveitamento do comportamento do usuário para criar blocos de resultados. Os próximos posts descrevem muitas das coisas que podem ser realizadas por meio das regras de consulta.

Lista de resultados de classificação única:

As Regras de Consulta permitem interpretações diversas da mesma consulta. Talvez uma interpretação incida sobre uma restrição de tipo, como no exemplo acima, resultando em um conjunto de documentos. Outra regra poderia disparar em "Marketing" como sendo uma disciplina bem definida a partir de um dicionário de categorias de trabalho em uma empresa como a Microsoft e assim retornar um conjunto de resultados especificamente delimitados para o repositório de RH corporativo que possui conteúdo cuidadosamente moderado para cada disciplina. E, provavelmente, também faz sentido supor que ambas as interpretações poderiam estar erradas e que a consulta tradicional de palavra-chave no índice teria mais probabilidade de encontrar os resultados que o usuário estava procurando. Recombinar os três conjuntos de resultados em uma única página levou ao conceito de blocos de resultados. Estes aumentam a lista única de classificação dos resultados individuais com um conjunto de classificação dos blocos que estão inseridos em vários locais, cada bloco contendo resultados classificados individualmente.

Mais uma vez, toda esta área requer uma explicação mais detalhada para mostrar o poder dos conceitos subjacentes.

A captura de tela a seguir mostra um exemplo: a página de resultados para a consulta "plataforma de marketing" mostra um bloco com as "plataformas" (as apresentações) que correspondem à consulta "marketing", seguida pelos resultados normais da consulta completa.

Links com resumos de três linhas:

Ficou claro que as tentativas de comprimir mais informações no mesmo espaço de pixels disponível na tela não conseguiriam melhorias reais na capacidade de um usuário inspecionar os resultados rapidamente para encontrar o melhor. A solução foi criar um painel hover, que poderia mostrar de forma ampliada visualizações dos sites, documentos e conversações. Isso também nos proporcionou espaço para expandir, a partir de uma experiência projetada como via de mão única, a leitura de um documento ou página da Web em um conjunto de ações extensíveis que os usuários podem utilizar diretamente nos resultados de pesquisa. Por exemplo, acompanhar o documento, ir direto ao Modo de Edição, compartilhar ou abrir a biblioteca onde o documento esteja armazenado para ver qual conteúdo está disponível — e essas são apenas as funções padrão.

Por último, mas não por isso menos importante, em vez de apostar apenas em resumos textuais, habilitamos a extração das seções semânticas para vários tipos de documentos, que são mostrados como poderosos "links profundos" dentro do painel hover. Já que é provável que os títulos dos slides de uma apresentação de PowerPoint tenham sido cuidadosamente projetados pelo apresentador para resumir o conteúdo de cada slide, mesmo que o nome do arquivo não seja particularmente descritivo.

Nós agora extraímos e mostramos os títulos de slide de acordo com as palavras-chave, permitindo que um usuário possa fazer um zoom em uma consulta de mais de 100 milhões de itens no índice baixo de um único slide com um título relevante e, em seguida, abrir a apresentação exatamente nesse slide, com um único clique. Este recurso também está disponível nos documentos do Word e do Excel (focado em gráficos e tabelas de nomes), além de sites do SharePoint (subsites e bibliotecas de documentos mais relevantes).

A estrutura da interface que suporta todos esses novos recursos também foi projetada novamente. Ela é baseada em um conjunto de modelos de layout aninhados definidos em JavaScript e HTML para uma extensibilidade muito mais fácil. Cada tipo de resultado tem um modelo para controlar o layout da lista de resultados e um modelo de painel hover. Os layouts de bloco são controlados por um modelo separado e, em seguida, o layout de todos os resultados é definido por um modelo de grupo, Todos eles podem ser adaptados ao layout de apresentação desejada. Um exemplo é que a pesquisa de vídeo incluída por padrão usa um layout de grade, com layouts de resultado personalizados para apresentar os resultados de vídeo. Uma aparência bem diferente, alcançada simplesmente com troca do modelo, sem nenhuma alteração de código na base de resultados da webpart necessária.

Juntas, essas melhorias criam uma experiência de usuário potente e altamente sensível, podem ser acessadas de qualquer lugar do SharePoint, compreendem a consulta do usuário muito melhor e proporcionam resultados altamente visuais com acesso direto à informação mais refinada incluída nos sites e documentos, assim como permitem que os usuários explorem os resultados sem ter que deixar a página de resultados.

A imagem seguinte mostra um exemplo de como seria essa experiência em uma apresentação do PowerPoint: os links para os títulos de slide relevantes dentro do arquivo, uma vista prévia que permite que o usuário consulte as páginas de forma interativa e um conjunto de links de ação no fundo do painel.

Pesquise enquanto uma informação acessa a plataforma

O terceiro objetivo foi estabelecer a plataforma de pesquisa de forma que o acesso à informação seja mais generalizado.
Um índice de pesquisa coorporativa devidamente configurado constitui uma incrível coleção de informações disponíveis em uma empresa. Ele faz com que os silos de informação se entrecruzem em diferentes sistemas de gerenciamento de documentos e também com que o esquema de metadados seja normalizado por meio desses sistemas.

Expor toda essa informação como uma experiência de usuário interativa e orientada pela palavra-chave é ótimo, mas por que parar aqui? Há muitas experiências de informações que poderiam se beneficiar ao reunir uma visão centrada no usuário que ultrapasse os limites dos silos subjacentes e tirar proveito da correspondência e classificação do conteúdo baseado em palavras-chave para mostrar os itens mais adequados primeiro.

Para mostrar o que isso significa, quero destacar alguns dos exemplos que estão incluídos por padrão no SharePoint 2013:

Em Meus Sites, os usuários podem acessar uma lista de todas as tarefas SharePoint atribuídas a eles, independentemente de onde estejam armazenadas essas atribuições.
Cada biblioteca de documentos agora tem uma caixa de pesquisa no topo que permite aos usuários pesquisar tanto os metadados quanto os textos completos de seus documentos. A lista de resultados é apresentada como uma visão do SharePoint padrão em vez de uma página de resultados.
Ao clicar sobre um hash tag em um post ou em uma discussão, uma lista de todas as conversas sobre o assunto será exibida em toda a empresa.

Há diversos recursos novos disponíveis nessa versão, como a nova maneira de definir os tipos com base em regras (por exemplo, um contrato deve ser diferente do um arquivo "Word" genérico), maior relevância integrada ajustada na interface e também por meio do XRANK, eDiscovery que abrange o SharePoint e o Exchange, rastreamento contínuo que mantém o conteúdo ainda mais atualizado, instalações para combinar os resultados das propriedades do O365 com resultados no local em configurações "híbridas", e agora o sistema também oferece o OMCS e as RESTful APIs e muito, muito mais.

Esperamos que você desfrute — saiba como experimentar o ambiente online do O365 Preview, ou faça o download dos componentes aqui e instale-os na sua máquina.

Fale conosco e deixe sua opinião.

G.

Este é um post traduzido do blog. O arquivo original pode ser encontrado em Overview of Search in SharePoint 2013