Panoramica della funzionalità di ricerca in SharePoint 2013

Articolo originale pubblicato sabato 29 settembre 2012

Breve presentazione:
Mi chiamo Gerhard Schobbe e sono Group Program Manager per il team dell'organizzazione di SharePoint che si occupa degli scenari di ricerca per gli Information Worker in ambito aziendale.

Obiettivi della versione

Lasciatemi innanzitutto parlare degli obiettivi di questa versione.

Come per qualsiasi versione, sono diverse le aree in cui intendiamo fare progressi. Per Office 2013 erano prioritarie tre questioni:

  • Passare a un'unica piattaforma per la ricerca di contenuti nell'organizzazione.
  • Garantire un miglioramento visibile per gli utenti finali che interagiscono con il sistema di ricerca.
  • Definire tale piattaforma come livello di accesso alle informazioni più generale per le applicazioni, incluse altre aree di SharePoint e, naturalmente, lo sviluppo da parte di terze parti.

Mi soffermerò su ognuno di questi aspetti e utilizzerò alcuni esempi per illustrare i passi avanti che abbiamo compiuto. Questo post di carattere generale sarà seguito nelle prossime settimane e nei prossimi mesi da una serie di presentazioni più dettagliate degli elementi e dei processi alla base dei diversi sottosistemi.

Singola piattaforma di ricerca

Per iniziare, occupiamoci dell'obiettivo di avere un'unica piattaforma per la ricerca di contenuti nell'organizzazione. Con l'acquisizione di FAST a metà del 2008 e la successiva uscita di Office 2010, nel prodotto Microsoft SharePoint 2010 è stata inclusa un'offerta di ricerca a due livelli basati su stack di tecnologie diversi. SharePoint 2010 infatti include un sistema di ricerca di contenuti nell'organizzazione basato su una base di codice sviluppata a Redmond, mentre il livello più alto include FAST Search Server 2010, un sistema sviluppato in base allo stack di tecnologie FAST sulla scia dell'acquisizione.

Era tuttavia chiaro anche che un sistema che potesse combinare il meglio di entrambe le implementazioni avrebbe offerto un migliore prodotto per la ricerca di contenuti nell'organizzazione, semplificando le scelte per i clienti e quindi offrendo un doppio vantaggio. Il processo di riconcepire l'intera architettura offriva inoltre l'opportunità di integrare molti dei moderni componenti su cui FAST aveva lavorato e che ancora non erano stati rilasciati diffusamente, inclusi framework aggiornati per l'elaborazione di query e contenuto.

Il risultato di questo piano, dopo diversi anni di attività di progettazione, è un sistema che combina il framework di crawler e connettori già noto della funzionalità di ricerca di SharePoint con i framework di elaborazione di contenuto e query della prossima generazione di FAST, che interagiscono tutti con un nucleo di ricerca basato su FAST Search.

Le esperienze utente predefinite per gli utenti finali e gli amministratori IT sono di nuovo ospitate in SharePoint, dove l'esperienza per gli utenti finali è stata completamente ripensata partendo da un approccio di rendering basato su server nella versione 2010 per giungere a un approccio del lato client asincrono. Torneremo su questo argomento più avanti.

Siamo inoltre stati in grado di integrare un nuovo motore di analisi che funge da runtime per un ventaglio di processi con elementi consigliati e algoritmi di classificazione.
 
È opportuno sottolineare come sia stata svolta una grossa mole di lavoro per ospitare la piattaforma di ricerca nel cloud: sarà alla base del servizio O365 quando l'ultima versione sarà online.
 
Nella figura seguente è riportato un riepilogo grafico. Fare clic sull'immagine per ingrandirla.

 

 

Creazione di un'esperienza utente incredibile

 

 

Questo ci porta alla seconda area in cui abbiamo investito, ovvero garantire miglioramenti tangibili per tutti gli utenti finali. Tradizionalmente un utente immetteva in una home page del Centro ricerche una serie di termini di ricerca che venivano trattati come parole chiave e i risultati erano un singolo elenco classificato di collegamenti con riepiloghi di tre righe e pochi metadati. Ecco come siamo passati al livello successivo in ognuno di questi casi.

 

La home page del Centro ricerche è il punto di ingresso principale:

 

In questa versione ogni casella di ricerca di ogni sito del team consente un accesso completo alla ricerca di contenuti nell'organizzazione, alla ricerca utenti e ad altre esperienze di ricerca specializzate, oltre che alla ricerca tradizionale avente come ambito il sito. Gli utenti possono accedere all'ambito desiderato dall'elenco a discesa all'interno della casella di ricerca.

Tutte le potenzialità delle esperienze di ricerca a livello dell'organizzazione sono quindi a portata di mano di qualsiasi utente che lavori in un sito del team o in uno dei diversi hub intorno a SharePoint. 

Ogni termine è una parola chiave:

Un'attenta analisi di diversi log di query dei clienti per cui abbiamo ottenuto le autorizzazioni ha mostrato chiaramente che molte query degli utenti sono una combinazione di parole chiave e parole di comando, in cui queste ultime possono indicare il tipo di risultato che l'utente sta ricercando. Un'altra estesa classe di query è risultata quella delle query di navigazione, nel senso che il risultato previsto era un percorso, ad esempio un sito del team, un altro sito Web, una raccolta documenti o persino un documento specifico che l'utente ha già utilizzato qualche volta.

 

Per espandere il concetto delle parole di comando, esaminiamo come esempio la definizione "piattaforma di marketing" (in inglese "marketing deck", considerando che il termine "deck" può indicare anche un insieme di diapositive). Per una qualunque persona, l'utente sta chiaramente cercando una presentazione riguardante il marketing, ma nessuna delle presentazioni conterrà la parola "deck" perché è appunto un termine gergale. Ha quindi più senso classificare i termini nella query come effettive parole chiave ("marketing" in questo caso) e parole di comando da trasformare in altri vincoli per la query, in questa circostanza un tipo di vincolo che limiti i risultati a tutti i tipi di file definiti come presentazioni. La stessa idea si applica, ad esempio, ai suggerimenti che l'utente sta cercando per un sito o che sta specificamente cercando per documenti che non sono pagine Web. Questo processo di pensiero ha portato all'introduzione delle regole di query, ovvero un sistema estendibile generalizzato per l'analisi delle query che associa i termini di una query a parole chiave e consente la trasformazione delle parole di comando in query relative alle proprietà. Le regole di query hanno inoltre funzionalità più avanzate, inclusa la possibilità di basarsi sul comportamento dell'utente per creare blocchi di risultati. Ulteriori post del blog approfondiranno tutte le attività che è possibile eseguire con le regole di query.

Singolo elenco classificato di risultati:

 

Le regole di query consentono diverse interpretazioni della stessa query. Un'interpretazione forse è basata su un tipo di restrizione come nell'esempio precedente, che dà come risultato un insieme di documenti. Un'altra regola può basarsi su "marketing" in quanto disciplina ben definita in un dizionario di categorie professionali presso un'azienda come Microsoft e quindi restituire un set di risultati che ha come ambito specifico l'archivio delle Risorse umane aziendale con contenuto attentamente moderato per ogni disciplina. Ha inoltre senso probabilmente presupporre che entrambe queste interpretazioni potrebbero essere errate e che la query con parole chiave tradizionale sull'indice avrebbe le maggiori possibilità di recuperare i risultati appropriati che l'utente stava cercando. Ricombinando i tre set di risultati in un'unica pagina, si è giunti al concetto di blocchi di risultati. Questi estendono l'elenco unico classificato di singoli risultati con un set classificato di blocchi che vengono inseriti in diverse posizioni, dove ogni blocco contiene risultati classificati singolarmente.

Anche quest'area richiede una spiegazione molto più dettagliata per mostrare la valenza dei concetti sottostanti.

Nella schermata seguente viene illustrato un esempio. Nella pagina dei risultati per la query relativa alla "piattaforma di marketing" (marketing deck) viene mostrato un blocco con tutti gli elementi "deck" (le presentazioni) che soddisfano i criteri della query "marketing", seguito dai normali risultati della query completa.

 

Collegamenti con riepiloghi di tre righe:

 

Era chiaro che i tentativi di inserire ancora più informazioni nella quantità di spazio in pixel disponibile sullo schermo non avrebbero portato a veri miglioramenti in termini di capacità di un utente di verificare rapidamente i risultati per trovare quello più adatto. La soluzione è stato un riquadro al passaggio del mouse che poteva essere ingrandito ulteriormente per avere anteprime grafiche di siti, documenti e conversazioni. Ci ha inoltre dato modo di passare da un'esperienza progettata implicitamente come strada a senso unico alla lettura di un documento o di una pagina Web come un set di azioni estendibile che gli utenti potrebbero eseguire direttamente sul risultato di ricerca. Ad esempio, accedere a un documento, passare alla modalità di modifica oppure condividere o aprire la raccolta in cui è archiviato il documento per visualizzare il resto del contenuto disponibile, e queste sono solo le azioni predefinite.

Non ultimo, è necessario considerare il fatto che, invece di basarci esclusivamente su riepiloghi di testo, abbiamo abilitato l'estrazione delle sezioni semantiche per diversi tipi di documenti, che vengono visualizzate come potenti "collegamenti diretti" all'interno del riquadro al passaggio del mouse. È infatti probabile che i titoli delle diapositive di una presentazione di PowerPoint siano stati studiati attentamente dal relatore in modo da riepilogare al meglio il contenuto di ogni diapositiva, anche se il nome del file non è particolarmente descrittivo.

Ora estraiamo e visualizziamo i titoli delle diapositive che corrispondono alle parole chiave, consentendo a un utente di eseguire lo zoom e passare da una query su 100 milioni di elementi nell'indice fino a una singola diapositiva con un titolo pertinente e quindi di aprire la presentazione esattamente a tale diapositiva con un solo clic. Questa funzionalità è disponibile anche per i documenti di Word ed Excel (soprattutto per i grafici e le tabelle denominate), oltre che per i siti di SharePoint (siti secondari di primo livello e raccolte documenti).
 
Anche il framework dell'interfaccia utente che supporta tutte queste nuove funzionalità è stato riprogettato. È basato su un set di modelli di layout nidificati che sono definiti in JavaScript e HTML per una più agevole estendibilità. Ogni tipo di risultato ha un modello per controllare il layout nell'elenco dei risultati e un modello di riquadro al passaggio del mouse. I layout dei blocchi sono controllati da un modello separato e quindi il layout di tutti i risultati è definito da un modello di gruppo. Questi elementi possono essere tutti adattati al layout di presentazione desiderato. Un esempio è costituito dalla ricerca video, inclusa per impostazione predefinita, che utilizza un layout griglia con layout dei risultati personalizzati per presentare i risultati relativi ai video. Un aspetto decisamente diverso, ottenuto semplicemente cambiando modello senza che sia necessario apportare modifiche al codice della web part dei risultati di base.

Insieme, questi miglioramenti generano un'esperienza utente efficace e reattiva a cui è possibile accedere da qualsiasi punto di SharePoint, che comprende meglio la query dell'utente e che garantisce risultati decisamente visibili con accesso diretto alle informazioni più specifiche all'interno dei siti e dei documenti, e che quindi consente agli utenti di agire sui risultati senza dover uscire dalla pagina dei risultati.

Nella figura seguente viene illustrato un esempio dell'esperienza offerta per una presentazione di PowerPoint: collegamenti ai titoli delle diapositive rilevanti all'interno del file, un'anteprima grafica che consente all'utente di spostarsi nella presentazione in modo interattivo e una serie di collegamenti ad azioni nella parte inferiore del riquadro.



Ricerca come piattaforma di accesso alle informazioni

Il terzo obiettivo era quello di definire la piattaforma di ricerca come una piattaforma di accesso alle informazioni più generalizzata.
Un indice di ricerca di contenuti nell'organizzazione configurato correttamente è una raccolta incredibile di informazioni disponibile in un'azienda: si estende sui silo di informazioni di diversi sistemi di gestione documenti e normalizza lo schema dei metadati fra tali sistemi.

L'esposizione di tutte queste informazioni come un'esperienza utente interattiva basata su parole chiave è sicuramente un fattore positivo, ma perché fermarci qui? Sono molte le esperienze basate su informazioni che trarrebbero vantaggio dall'utilizzo di un'unica visualizzazione incentrata sull'utente che non tenga conto dei limiti dei silo sottostanti e sfrutti la classificazione e la ricerca di corrispondenze basata su parole chiave del contenuto per mostrare per primi gli elementi più appropriati.

Per spiegarmi meglio, voglio soffermarmi su alcuni degli esempi inclusi per impostazione predefinita in SharePoint 2013:

  • Nei siti personali gli utenti possono accedere a un elenco di tutte le attività di SharePoint loro assegnate, indipendentemente dai siti in cui sono archiviate le assegnazioni.
  • Ogni raccolta documenti ora dispone di una casella di ricerca nella parte superiore che consente agli utenti di ricercare nei metadati e nell'intero testo dei relativi documenti. L'elenco dei risultati viene presentato come una visualizzazione di SharePoint standard anziché come una pagina dei risultati.
  • Facendo clic su un hashtag all'interno di un post o di una discussione, viene visualizzato un elenco di tutte le conversazioni relative a tale argomento a livello dell'intera azienda.

In questa versione sono disponibili molte altre nuove funzionalità eccezionali, tra cui un nuovo modo per definire i tipi in base alle regole (ad esempio, un contratto deve essere diverso dal tipo di file generico "Word"), una maggiore pertinenza da progettazione ottimizzabile nell'interfaccia utente e tramite XRANK, eDiscovery su SharePoint ed Exchange, la ricerca per indicizzazione continua per mantenere aggiornato il contenuto, funzioni per combinare i risultati di tenancy di O365 con risultati locali in configurazioni "ibride", API CSOM e RESTful ora offerte nel sistema e tanto altro ancora.

 

Speriamo che tutto questo vi piaccia. Iscrivetevi per l'ambiente O365 Preview online oppure scaricate il codice qui e installatelo in un computer locale.

Segnalateci le vostre opinioni!
 
G.

Questo è un post di blog localizzato. L'articolo originale è disponibile in Overview of Search in SharePoint 2013.