云南網站建設創(chuàng)新企業(yè) 昆明多彩網絡公司

搜索引擎算法之:謹慎對待同義詞

來源:昆明多彩網絡公司 日期:2011-02-20 閱讀: 發(fā)表評論

中文中有很多詞語是同義詞的,百度詞匯當中也能很好的識別同義詞,但是在百度的搜索結果當中我們可以看出來百度對于同義詞的匹配是相當謹慎的

在搜索引擎中有一個很重要的分詞技術,比如將一個長的詞語分解成若干個短語,然后再根據這些短語呈現最終的搜索結果,而我們這里說得同義詞并非搜索引擎中的分詞技術,說的是一個該怎么樣去理解用戶意圖的技術。

比如說我們搜索“網站制作”和“網頁制作”這兩個同義詞語,可以對比一下搜索出來的結果,發(fā)現還是有很多不同的,雖然這兩個詞語的意思基本相同;而我們再搜索競爭較小的同義詞的時候就可以發(fā)現搜索結果相似程度的就出現上升趨勢。

這里我們可以大膽的猜測一下影響搜索引擎對于同義詞搜索結果的相關因素:

1、兩個同義詞如果意義非常接近,同時相關信息較少的話,搜索引擎會自動匹配這兩個詞語,并且呈現大部分相同的結果。

2、兩個同義詞意義非常接近,但是詞語的搜索指數很高,同時相關的網站競爭排名也非常激烈,那么呈現出來的結果就會迥異。

3、如果兩個同義詞前面加上了地域或者其他限制性的前綴,搜索引擎會考慮將這兩個詞語當成一個關鍵詞來對待,但幾率較小。

4、對于冷門和一些專業(yè)術語,搜索引擎如果在自身數據庫中有兩個同義詞的數據,將同義詞當成一個關鍵對待的幾率將大大加大。

以上猜測僅參考了少部分的搜索詞語,搜索引擎對于同義詞的匹配和對待的態(tài)度是非常的謹慎,更多更準確的數據就需要更多的關鍵詞語去驗證了。

發(fā)表評論評論列表(有 條評論)