知識庫相關文章彙整
google搜尋引擎分詞技術偏重語句的片語區別於自然語言搜尋
在平時我們使用搜尋引擎的時候,我們通常都是輸入一個詞語進行搜尋,比如我們要去南部旅遊,通常輸入有名的旅遊勝地的名字,如墾丁公園,西子灣,四重溪等這些名字,對要去的地點搜尋瞭解,這些我們常用來搜尋的字詞稱之為搜尋關鍵字。很少人輸入一句完整的話進行搜尋。
所以很多的SEO就研究什麼樣的詞語會是線上瀏覽者經常用來搜尋的,然後針對目標關鍵字對網站進行優化,還有一件事情是SEO們對網站進行優化時是必須要做的,就是研究一個網頁包括網頁標題,網頁內容描述,網頁段落的組織,關鍵字的密度的分析等這個工作對一個網頁的內容進行有規劃的安排,迎合搜尋引擎的習慣和友好度。
在網頁的標題和內容的寫作上,SEO網站優化有一個功課是必需過關的,也就是在安排和規劃內容的時候一定要瞭解各大搜尋引擎的分詞技術,簡單的講就是指搜尋引擎對一篇文章內容進行分析時,是如何提取關鍵字的?如何辨別這篇文章講了與什麼詞語相關的內容?所以SEO網站優化就開始了對如:Google、Live Search、Yahoo!奇摩...等主要的搜尋引擎分詞技術的探索之路。
據國外媒體報導,雖然美國已經出現了多個挑戰Google的自然語言搜尋引擎,但是Google對此的興致並不高。Google的研發負責人日前表示,線上瀏覽者太懶,他們並不願意輸入一個完整的句子,Google更關心片語層面上的自然語言搜尋技術。
作出上述表態的是Google公司負責研發的皮特•諾維格。對於一些搜尋引擎支持用戶輸入整個句子,諾維格作出了評論。他說:『在搜索框中敲入一個句子,而不是關鍵字,我們認為這不算什麼進步。比如,敲入“法國首都是哪裡”,他所得到的結果不一定比敲入“法國首都”得到的結果更加理想』。
不過諾維格也表示, 在把關鍵字“翻譯成”人們的普通概念方面,Google認為自然語言技術還是有一定的價值。他舉例說:“New York” 和“York”是不一樣的,但是“Vegas” 和“Las Vegas(拉斯維加斯)”卻是一個意思,而“Jersey” 和“New Jersey(新澤西)”可能一樣,也可能不一樣。這就是Google公司關注的自然語言技術,他們更多關注的是單詞和片語方面,而不是分析用戶輸入的整個句子。
諾維格表示對於Google來說,獲得更加準確的結果,比改變使用者介面更為重要。
在此之前美國第四大搜尋引擎Ask.com曾經推出過自然語言搜尋技術,但是也只是把句子拆解成為關鍵字,搜尋結果和關鍵字搜尋模式差不多,由於智慧性差於Google,Ask.com的自然語言搜尋結果比不上Google的關鍵字搜索結果。後來Ask.com停止了句子搜尋的服務。
從以上的Google官方的表示可以知道,搜尋引擎對一個句話所講的內容進行分詞和對比,從而得出一個網頁所講的內容,由於英文和中文在語法有不同,包括人們的習慣用語也不同,所以中文搜尋引擎和英文搜尋引擎在搜索的結果當中所得出來結果就分詞技術不同而不同,在這裡您可以用一個關鍵字分別在Yahoo和Google進行試驗,在很大程度上搜尋引擎也是不斷的去對線上瀏覽者的使用習慣,分詞等不斷努力,只有這樣才能保證搜索出來的網頁最接近線上瀏覽者想要的。
每一天在我們生活和工作中都會產生很多新的名詞,通過對這些新的名詞在不同的搜尋引擎進行搜索,看結果您就可以判斷哪一個搜尋引擎的搜索結果更接近於我們想要的,哪一個搜尋引擎的分詞技術就更先進了。SEO網站優化是一條長遠探索之路,我們願意把自己所發現的新技術,總結的經驗和大家一起分享。
(此篇文章為網路轉載,如有冒犯,請來信告知,當即刻移除!)