使用基于自定义实体的精简程序改进搜索结果的导航

原文发布于 2012 年 12 月 7 日(星期五)

受众:搜索管理员/IT 专业人员
先决条件:本文假定读者具有搜索管理的基本知识。

当要简化搜索结果中的导航时,如果您的文档已经有元数据,则可以启用基于此元数据的精简程序。但是,如果文档没有要精简的此特定元数据该怎么办?在这种情况下,您仍然有办法快速缩小搜索结果的范围并创建基于从文档内容中提取的自定义实体的精简程序。

假设您的组织 Contoso 有一项认证计划,其中包含几个您要用于精简搜索结果的认证名称。以下步骤将演示如何从文档的正文和标题中提取这些认证名称以及如何创建基于这些名称的精简程序。 

1.       创建包含 Contoso 认证名称的列表的 .csv 文件并通过 PowerShell cmdlet Import-SPEnterpriseSearchCustomExtractionDictionary 导入此词典。

以下是一个示例词典:

利用该词典,您不仅能指定要匹配的内容(键),还能指定如何在精简程序中呈现它(显示窗体)。利用显示窗体,您可以将不同的变体映射到一个标准名称。在本示例中,“Contoso Certified Master”、“Contoso Certified Solutions Master”等均显示为“CCM”。

使用 Windows PowerShell 导入词典时,必须定义自定义实体提取程序的类型。您选择的类型取决于要采用的与内容中的实体匹配的方式。您可以对整个单词或单词的一部分执行区分大小写或不区分大小写的匹配。在本示例中,您希望对整个单词采用不区分大小写的匹配,因此您将通过在 Windows PowerShell cmdlet 中指定 Microsoft.UserDictionaries.EntityExtraction.Custom.Word.1 选择自定义单词提取。如果您的内容是采用不用空格分隔的语言(如日语)编写的,则应考虑与单词的一部分匹配。 

2.       对文档内容启用自定义实体提取。

转到搜索架构并通过启用要实现的自定义实体提取程序类型来配置托管属性“正文”和“标题”。此类型应该与您在第 1 步中导入词典时指定的类型相同。

在本示例中,既然您已在第 1 步中导入了此类型的词典,您就应该启用“单词提取 - 自定义 1”(Word Extraction - Custom1):

 

3.       对文档集合进行爬网。

导入词典并对一个或多个托管属性启用自定义提取后,必须完成对内容的完全爬网。 

4.       启用新的 Contoso 认证精简程序。

在搜索结果页上编辑精简 Web 部件以启用自定义精简程序。

 

就是这样!搜索结果页现在将包含基于您的自定义实体提取程序的精简程序:

 

 

若要获取详细信息,可以查看 https://technet.microsoft.com/zh-cn/library/jj219480.aspx 上的文档。

 

这是一篇本地化的博客文章。请访问 Improve navigation through search results using refiners based on custom entities 以查看原文