如何達到搜尋結果的最佳有效時間?適用於 SharePoint 的連續編目簡介

英文原文已於 2012 年 9 月 15 日星期六發佈

對象:搜尋管理員/IT 專業人員
先決條件:本部落格假設讀者已經具備有關 SharePoint 搜尋拓撲、編目機制,以及編目排程原則的基本搜尋管理知識。
附註:此功能是 SharePoint 2013 的新功能。

什麼是搜尋結果的有效時間?
在使用者將文件上傳至其 SharePoint 網站之後,在文件可透過 SharePoint 搜尋入口網站進行「搜尋」之前的這段時間稱為有效時間的延遲。

有效時間的依據是什麼?
有很多因素 - 存放庫的大小、變更速率、來自存放庫的要求回應時間、編目排程、變更的類型。這是因為若要讓文件可供「搜尋」,需要觸發編目 (可以手動或透過排程自動觸發),變更需要進行識別、要求和處理。

所以,問題是什麼呢?
傳統上,會在 Sharepoint 搜尋中提供兩個排程選項 - 完整編目或累加編目。完整編目會開始探索整個主機,而累加編目只會處理主機中自從上次發生編目之後已變更的項目 (可能是使用每份文件的時間戳記比較,也可能是針對追蹤已修改之文件的存放庫使用預先存在的變更記錄)。為了達到較長的有效時間,建議的處理方式是讓累加編目更積極進行 (例如,每天每 30 分鐘執行一次)。

完整編目與累加編目的其中一項限制是它們無法平行執行,例如,若有某個完整編目或累加編目正在進行,則系統管理員便無法在該內容來源上開始另一個編目。這會對編制項目索引的方式強制執行先進先出處理方式。此外,某些類型的變更會導致執行階段延長 (例如,在主機根層級上的原則變更,表示整個主機需要重新編制索引以更新每個已索引項目的安全性描述元)。將這兩個因素結合在一起會導致有效時間產生變動,即使已設定經常性累加編目排程也一樣。為了說明這一點,以下為累加編目的預期心理模型 (相較於現實世界),之後緊接著該系統的有效時間。

 

 

 

所以,該如何修正?連續編目的簡介
我建議針對 SharePoint 類型的內容來源使用編目選項,提供免排程的替代項目來管理內容來源。基礎結構是設計來藉由克服完整/累加編目的兩個基本限制,確保一致的有效時間:

  • 它們可以平行執行
  • 一個深度變更將不會導致後續所有變更的有效時間降級

告訴我更多資訊…
幕後作業是,選取連續編目將導致每 15 分鐘啟動一次編目,而不論之前的工作階段是否已完成。這表示在深度變更之後立即進行的變更不需要在後面「等待」。當深度原則變更在其他連續編目工作階段上運作時,新變更將持續進行平行處理。以下圖表說明連續編目如何每 15 分鐘平行向上微調,以協助管理突然增加的內容量,而不會影響整體有效時間。下圖說明對於在累加編目上使用連續編目來達到之有效時間的影響。

 

 

那麼,我還需要知道哪些內容?
在後續部落格中,我們將更詳細地檢閱連續編目如何處理不同類型的案例 (錯誤、安全性等),以及您如何使用編目記錄檔和編目記錄,更深入了解其中發生哪些狀況。

常見問題集:

我可以針對所有類型的內容來源使用連續編目嗎?
否。連續編目僅適用於 SharePoint 類型的內容來源。所有其他類型的內容來源都將繼續使用累加編目和完整編目做為選項。

使用連續編目會在存放庫上新增其他負載嗎?
連續編目的使用量類似累加編目。若已提高提出要求的頻率,則某個存放庫/主機上的同時要求數目上限將仍會受到「編目影響規則」(此規則定義可同時提出要求的執行緒上限,預設為 12 個執行緒,但可針對每個業務需求和/或容量規劃進行修改) 所控制。

在使用連續編目時,我需要設定累加編目或完整編目嗎?
累加編目不需要和連續編目一起設定。

連續編目會在主機/存放庫上新增其他負載嗎?
連續編目會稍微增加主機上的負載,因為它會以繼承方式同時平行執行多個工作階段。但應該注意的是,它將符合「編目影響規則」設定,此設定控制可對主機同時提出的要求數目上限 (其 OOB 已設為 12 個執行緒,但可加以變更)。

我可以使用連續編目來進行舊版 SharePoint 內容的編目嗎?
是 -- 儘管搜尋應用程式必須為 2013 版,但還是可以將執行舊版 SharePoint 的內容伺服器陣列設為連續編目。

這是翻譯後的部落格文章。英文原文請參閱 How can I achieve the best freshness of search results? Introducing Continuous Crawls for SharePoint