搜索引擎接收到用戶輸入的搜索詞后,需要對搜索詞做一些處理,才能進入排名過程。

搜索詞處理包括以下幾方面:
(1)中文分詞。與頁面索引時一樣,搜索詞也必須進行中文分詞,將查詢字符串轉換為以詞為基礎的關鍵詞組合。分詞原理與頁面分詞相同。
(2)指令的處置。平時咱們在搜索時會輸入多個詞語,實在默認的情況下,搜索引擎把多個默認的詞語都依照“與”來進行詞語。比方你搜索“seo”“培訓”時,搜索引擎會默認咱們輸入的“seo培訓”來進行處置,獨自包括“seo”或者“培訓”的網站內容實踐上將不會返回,但實際情況往往也會呈現獨自包括一個詞語的網站。另外,還要處置各種高等搜索指令的詞語,比方加號減號等。
(3)停止詞。和索引時一樣,搜索引擎也需要把搜索詞中的停止詞去掉,最大限度地提高排名相關性及效率。
(4)過錯糾正。用戶如果輸入了明顯錯誤的字或英文單詞拼錯,搜索引擎會提示用戶正確的用字或拼法。
(5)整合搜索觸發。某些搜索詞會觸發整合搜索,比如明星姓名就經常觸發圖片和視頻內容,當前的熱門話題又容易觸發資訊內容。
(6)匹配正向索引。將包含搜索詞的索引集合起來組成搜索引擎結果。
經過進一步的相關性計算、權重計算、鏈接計算等最終得到一個與搜索詞相關的索引集合,即搜索引擎展現結果,經過最后的懲罰等調整后,展現給用戶,對于經常搜索的搜索詞,搜索結果會緩存下來,一遍下次搜索時,能快速響應用戶的需求。