Übersicht über die Suchfunktion in SharePoint 2013

Veröffentlichung des Originalartikels: 29.09.2012

Schnelleinführung:
Mein Name ist Gerhard Schobbe. Ich bin Group Program Manager im Team der SharePoint-Abteilung, das sich auf Suchszenarien für Wissensarbeiter in Unternehmen konzentriert.

Ziele für diese Version

Lassen Sie mich zunächst die Ziele für diese Version erläutern.

Wie bei jeder Version gibt es mehrere Bereiche, auf deren Modernisierung wir abzielen. Drei davon waren auf der Liste für Office 2013 ganz oben:

  • Wechsel zu einer zentralen Suchplattform im Unternehmen
  • Ein wirklich erkennbarer Schritt vorwärts für Endbenutzer bei der Interaktion mit dem Suchsystem
  • Einrichten dieser Plattform als allgemeinere Informationszugriffsebene für Anwendungen, einschließlich anderer Teile von SharePoint und Drittanbieterentwicklungen

Auf diese drei Bereiche soll anschließend detaillierter eingegangen werden, wobei ich anhand von Beispielen unsere Fortschritte veranschaulichen werde. Auf diesen Übersichtsbeitrag wird in den kommenden Wochen und Monaten eine Reihe detaillierter Einblicke hinter die Kulissen der verschiedenen Untersysteme folgen.

Zentrale Suchplattform

Lassen Sie uns zunächst einen Blick auf die angestrebte zentrale Suchplattform für Unternehmen werfen. Mit der Übernahme von FAST Mitte 2008 und der nachfolgenden Markteinführung von Office 2010 umfasst die Microsoft SharePoint 2010-Produktlinie eine zweistufige Suchfunktion, deren Stufen auf verschiedenen Technologiestacks basieren: SharePoint 2010 bietet ein Suchsystem für Unternehmen, das auf einer in Redmond entwickelten Codebasis aufbaut. Auf der höheren Ebene ist FAST Search Server 2010 angesiedelt, ein auf dem FAST-Technologiestack basierendes als Folge der Übernahme entwickeltes System.

Es war jedoch klar, dass ein System, für das das Beste aus beiden Implementierungen zu einer zentralen Komponente kombiniert wird, eine bessere Suchlösung für Unternehmen darstellen und unseren Kunden die Wahl einfacher machen würde. Der Prozess des Überdenkens der Gesamtarchitektur bot darüber hinaus auch die Möglichkeit, mehrere der modernen Komponenten zu integrieren, an denen FAST gearbeitet hat, die aber noch nicht publik gemacht worden waren, so z.  B. aktualisierte Frameworks für Inhalts- und Abfrageverarbeitung.

Das Ergebnis dieser Entwicklung nach mehrjähriger Arbeit ist ein System, das das vertraute Crawler- und Connectorframework der SharePoint-Suchfunktion mit den Frameworks für Inhalts- und Abfrageverarbeitung von FAST der nächsten Generation verbindet, wobei alle Komponenten mit einem auf FAST Search basierenden Suchkern zusammenarbeiten.

Die standardmäßigen Benutzerumgebungen für Endbenutzer und IT-Administratoren werden wiederum in SharePoint gehostet, dessen Endbenutzerumgebung komplett umgestaltet wurde – weg von einem serverbasierten Renderansatz in SharePoint 2010 hin zu einem asynchronen clientseitigen Ansatz (mehr dazu später).

Darüber hinaus konnten wir ein neues Analysemodul integrieren, das als Laufzeit für eine Vielzahl von Abfragen wie Bewertungsalgorithmen und Empfehlungen dient.
 
Erwähnenswert ist, dass sehr viel Arbeit in die Entwicklung einer Suchplattform geflossen ist, die in der Cloud gehostet wird und als Unterstützung des Office 365-Diensts fungiert, sobald die neueste Version online geschaltet wird.
 
Die folgende Abbildung zeigt eine grafische Übersicht (klicken Sie darauf, um sie zu vergrößern).

 

 

Schaffen einer bahnbrechend neuen Benutzerumgebung

 

 

Damit gelangen wir zum zweiten Entwicklungsziel: bahnbrechende Verbesserungen für alle Endbenutzer. Üblicherweise gab ein Benutzer auf der Startseite des Suchcenters verschiedene Suchbegriffe ein, die als Stichwörter behandelt wurden. Das Ergebnis war eine einzelne Liste bewerteter Links mit dreizeiligen Zusammenfassungen und ein paar Metadaten. Lassen Sie mich Ihnen zeigen, wie wir in jedem Szenario auf die nächste Stufe gelangt sind.

 

Die Startseite des Suchcenters ist der Haupteinstiegspunkt:

 

Bei dieser Version bietet jedes Suchfeld auf allen Teamwebsites zusätzlich zur herkömmlichen bereichsbezogenen Websitesuche einen vollständigen Zugriff auf die unternehmensweite Suchfunktion, die Personensuche und andere spezialisierte Suchumgebungen. Benutzer können über die Dropdownliste im Suchfeld auf den gewünschten Bereich zugreifen.

Dadurch hat jeder Benutzer, der in einer Teamwebsite oder einem der verschiedenen auf SharePoint basierenden Hubs arbeitet, die Möglichkeit, die unternehmensweite Suchfunktion zu nutzen.

Jeder Begriff ist ein Stichwort:

Eine eingehende Analyse der Abfrageprotokolle mehrerer Kunden, die uns zur Verfügung gestellt wurden, ergab eindeutig, dass viele Benutzerabfragen eine Mischung aus Stichwörtern und Befehlswörtern sind, wobei letztere ggf. den Typ des Ergebnisses angeben, nach dem der Benutzer sucht. Eine weitere große Abfrageklasse waren Navigationsabfragen in dem Sinne, dass das erwartete Ergebnis ein Speicherort war, wie z. B. eine Teamwebsite, eine andere Website, eine Dokumentbibliothek oder sogar ein bestimmtes Dokument, das der Benutzer bereits mehrmals genutzt hat.

 

Zur weiteren Erläuterung des Konzepts von Befehlswörtern wollen wir als Beispiel den Begriff "marketing deck" untersuchen. Der Benutzer sucht (für das menschliche Auge) eindeutig nach einer Präsentation über Marketing, doch keine der Präsentationen wird das Wort "deck" enthalten, da es sich um einen gängigen Jargonbegriff handelt. Es ist wesentlich sinnvoller, die Begriffe in der Abfrage als tatsächliche Stichwörter (in diesem Fall "marketing") und Befehlswörter zu klassifizieren, die in weitere Einschränkungen für die Abfrage umgewandelt werden müssen. In diesem Fall in eine Typeinschränkung, die den Ergebnistyp auf alle Dateitypen begrenzt, die als Präsentationen definiert sind. Dasselbe Konzept gilt beispielsweise für Hinweise, dass der Benutzer eine Website oder spezifisch nach Dokumenten sucht, die keine Webseiten sind. Dieser Denkprozess führte zur Einführung von Abfrageregeln – einem verallgemeinerten, erweiterbaren System für die Abfrageanalyse, das die Begriffe einer Abfrage Stichwörtern zuordnet und die Umwandlung von Befehlswörtern in Eigenschaftsabfragen ermöglicht. Abfrageregeln bieten zudem erweiterte Funktionen wie das Auswerten des Benutzerverhaltens zum Erstellen von Ergebnisblöcken. In folgenden Blogbeiträgen werden alle die Dinge, die mithilfe von Abfrageregeln erreicht werden können, wesentlich eingehender untersucht.

Liste mit einzelnen Bewertungsergebnissen:

 

Abfrageregeln lassen mehrere Interpretationen derselben Abfrage zu. Eine Interpretation kann sich (wie im obigen Beispiel) auf eine Typeinschränkung konzentrieren, was zu einer Gruppe von Dokumenten führt. Eine andere Regel könnte bei "Marketing" als definierte Disziplin in einer Aufstellung von Abteilungen bei einem Unternehmen wie Microsoft ausgelöst werden und eine Gruppen von Ergebnissen zurückgeben, die sich spezifisch auf das Personalwesen des Unternehmens beschränkt und sorgfältig moderierte Inhalte für jedes Disziplin enthält. Und wahrscheinlich ist es ebenso sinnvoll anzunehmen, dass diese beiden Interpretationen falsch sein könnten und dass die herkömmliche Stichwortabfrage des Indexes die beste Chance bietet, die Ergebnisse zu liefern, die der Benutzer sich gewünscht hat. Die erneute Kombination dieser drei Ergebnisgruppen zu einer einzelnen Seite hat zum Konzept der Ergebnisblöcke geführt. Diese erweitern die Liste mit einzeln bewerteten Ergebnissen durch eine mit Bewertungen versehene Gruppe von Blöcken, die an verschiedenen Stellen eingefügt werden, wobei jeder Block einzeln bewertete Ergebnisse enthält.

Auch für diesen Bereich ist wiederum eine wesentlich detaillierte Erläuterung erforderlich, um die Leistungsfähigkeit der zugrunde liegenden Konzepte aufzuzeigen.

Das folgende Bildschirmfoto zeigt ein Beispiel – die Ergebnisseite der Abfrage "marketing deck" mit einem Block mit den Präsentationen, die der Abfrage "marketing" entsprechen, gefolgt von der regulären Ergebnissen der vollständigen Abfrage.

 

 

Es war klar, dass Versuche, noch mehr Informationen in den auf dem Bildschirm verfügbaren Platz zu packen, die Fähigkeit der Benutzer nicht wirklich verbessert, die Ergebnisse schnell zu untersuchen, um das Beste zu finden. Zur Lösung wurde der Daraufzeigebereich, der wesentlich größer eingeblendet werden kann, um eine Vorschau von Websites, Dokumenten und Unterhaltungen anzuzeigen. Dieser Bereich gab uns auch den Raum, um uns von einer Umgebung zu lösen, die implizit als Einbahnstraße des Lesens eines Dokuments oder einer Webseite konzipiert war, in Richtung einer erweiterbaren Gruppe von Aktionen zu entwickeln, die Benutzer direkt auf das Suchergebnis anwenden können. Beispielsweise einem Dokument folgen, unmittelbar in den Bearbeitungsmodus wechseln oder die Bibliothek freigeben oder öffnen, in der das Dokument gespeichert ist, um zu sehen, welche anderen Inhalte verfügbar sind – und das sind bloß die Standardaktionen.

Zu guter Letzt haben wir, anstatt nur auf Textzusammenfassungen zu setzen, bei verschiedenen Dokumenttypen die Extrahierung semantischer Abschnitte aktiviert, die im Daraufzeigebereich als leistungsstarke "Deep-Links" angezeigt werden. Denn es ist wahrscheinlich, dass die Folientitel in einer PowerPoint-Präsentation vom Referenten sorgfältig gewählt wurden, um den Inhalt jeder Folie zusammenzufassen, auch wenn der Dateiname nicht besonders aussagekräftig ist.

Wir extrahieren und zeigen nun die Folientitel als Reaktion auf die Stichwörter, wodurch der Benutzer sich bei einer Abfrage von über 100 Mio. Elementen im Index auf eine einzelne Folie mit dem entsprechenden Titel konzentrieren und anschließend die Präsentation präzise bei dieser Folie mit einem Mausklick öffnen kann. Diese Feature steht auch für Word- und Excel-Dokumente (mit Schwerpunkt auf Diagrammen und benannten Tabellen) sowie für SharePoint-Websites (Top-Unterwebsites und -Dokumentbibliotheken) zur Verfügung.
 
Das Benutzeroberflächen-Framework zur Unterstützung all dieser neuen Features wurde ebenfalls neu gestaltet. Es basiert auf einer Gruppe geschachtelter Layoutvorlagen, die für eine einfachere Erweiterbarkeit in JavaScript und HTML definiert sind. Für jeden Ergebnistyp gibt es eine Vorlage zum Steuern des Layouts der Ergebnisliste und eine Daraufzeigebereichsvorlage. Blocklayouts werden von einer gesonderten Vorlage gesteuert. Das Layout aller Ergebnisse wird schließlich mit einer Gruppenvorlage definiert. Alle diese Vorlagen können für das gewünschte Präsentationslayout angepasst werden. Ein Beispiel ist, dass für die standardmäßige gebotene Videosuche ein Rasterlayout mit angepassten Ergebnislayouts zum Präsentieren der Videoergebnisse verwendet wird. Dieses andere Aussehen ergibt sich aus einer einfachen Änderung einer Vorlage, ohne dass Codeänderungen am Webpart für die Basisergebnisse erforderlich sind.

Gemeinsam ergeben diese Verbesserungen eine leistungsstarke und reaktionsschnelle Benutzerumgebung, auf die in SharePoint von überall aus zugegriffen werden kann. Diese neue Umgebung versteht Benutzerabfragen wesentlich besser und liefert überaus visuelle Ergebnisse mit Direktzugriff auf die präzisesten Informationen in Websites und Dokumenten. Und sie ermöglicht Benutzer, Aktionen auf die Ergebnisse anzuwenden, ohne dass die Ergebnisseite verlassen werden muss.

Die folgende Abbildung zeigt ein Beispiel dieser Umgebung für eine PowerPoint-Präsentation: Links zu den relevanten Folientitel in der Datei, eine Vorschau, die es dem Benutzer ermöglicht, die Seiten der Präsentation interaktiv zu durchlaufen, und unten im Fenster eine Gruppe von Aktionslinks.



Suchfunktion als Informationszugriffsplattform

Das dritte Ziel war die Einrichtung der Suchplattform als eine allgemeinere Informationszugriffsplattform.
Ein ordnungsgemäß konfigurierter Unternehmenssuchindex stellt eine sehr nützlich Sammlung von in einem Unternehmen verfügbaren Informationen dar. Er gilt für die Informationssilos verschiedener Dokumentverwaltungssysteme und normalisiert ferner das Metadatenschema in diesen Systemen.

Das Verfügbarmachen all dieser Informationen in einer interaktiven, stichwortgesteuerten Benutzerumgebung ist wünschenswert, doch warum hier aufhören? Es gibt zahlreiche Informationsumgebungen, die von der Einrichtung einer benutzerzentrierten Ansicht profitieren würden, die die Grenzen der zugrunde liegenden Silos ignoriert und eine auf Inhaltsstichwörtern basierende Übereinstimmungs- und Einstufungstechnik nutzt, um die geeignetsten Treffer zuerst anzuzeigen.

Um zu zeigen, was das bedeutet, möchte ich einige der Beispiele hervorheben, die standardmäßig von SharePoint 2013 geboten werden:

  • In "Meine Websites" können Benutzer auf eine Liste aller ihnen zugewiesenen SharePoint-Aufgaben unabhängig von den Websites zugreifen, in denen die Zuweisungen gespeichert sind.
  • Jede Dokumentbibliothek enthält nun oben ein Suchfeld, mit dessen Hilfe Benutzer Metadaten und den vollständigen Text ihrer Dokumente durchsuchen können. Die Ergebnisliste wird als SharePoint-Standardansicht und nicht als Ergebnisseite angezeigt.
  • Durch Klicken auf ein Hashtag in einem Betrag oder einer Unterhaltung wird eine unternehmensweite Liste aller Unterhaltungen zu diesem Thema angezeigt.

Diese Version hat viele weitere spannende neue Features zu bieten, z. B. eine neue Möglichkeit zum Definieren von Typen basierend auf Regeln (ein Vertrag sollte sich beispielsweise vom allgemeinen Dateityp "Word" unterscheiden), bessere standardmäßige Relevanz, die auf der Benutzeroberfläche und über XRANK angepasst werden kann, sich auf SharePoint und Exchange erstreckende eDiscovery, kontinuierliche Durchforstung, durch die Inhalte noch aktueller bleiben, und Möglichkeiten zum Kombinieren von Ergebnissen aus Office 365-Instanzen mit lokalen Ergebnissen in sog. Hybridkonfigurationen. Außerdem bietet das System nun CSOM- und RESTful-APIs und vieles mehr.

 

Wir hoffen, die neue Suchumgebung gefällt Ihnen. Melden Sie sich für die Office 365 Preview-Onlineumgebung an, oder laden Sie die Software hier herunter, und installieren Sie sie auf einem lokalen Computer.

Teilen Sie uns Ihre Meinung mit!
 
G.

Es handelt sich hierbei um einen übersetzten Blogbeitrag. Sie finden den Originalartikel unter Overview of Search in SharePoint 2013