雅虎搜索是怎樣工作的? |
|
http://www.803ums.cn 2006年7月17日 |
|
|
|
搜集資料 首先搜索引擎會建立一個網頁地圖(Webmap),再使用網頁抓取程序(Robot)根據網頁地圖來抓取(Crawl)網頁,儲存到搜索數據庫中。 接下來會利用索引技術(Index)將數據做編號儲存,同時搜索技術也會利用一些相關技術將不好的網站(Spam)去除。
將搜索結果進行排序 當使用者輸入一個搜索詞查詢時,搜索引擎會用這個搜索詞到搜索數據庫中比對,并且經過一些相關度的運算之后,依照相關程度將網頁做排序,相關度高的排在前面。 相關度的運算,除了判別網站名稱或敘述內容中有符合搜索詞的搜索結果,運算程序還會根據該網頁被連結的次數等相關分數來計算,相關程度的高低是由搜索引擎程序運算,根據各種因素復合計算出來,并非絕對的單一因素。 更新網頁數據 網頁數據庫每天都會進行部分數據的更新,由于數據庫龐大,所有數據完全更新大約需要2到3個月的時間。 |
|
|
|
|
Copyright ©
SoWang.com.All
Rights Reserved |