中文搜索引擎指南網(wǎng)

搜索引擎目錄 - 搜索技巧 - 搜索營銷 - 網(wǎng)址之家- 電影搜索 - SOWANG音樂

 

首頁>>搜索快報>>正文

搜狗網(wǎng)頁搜索3.0將上線 收錄100億網(wǎng)頁

 

 http://www.803ums.cn   2006年12月7日


    全球首個收錄100億網(wǎng)頁的中文搜索引擎即將誕生

  日前,搜狐公司旗下自主品牌搜狗搜索引擎宣布,搜狗網(wǎng)頁搜索3.0版本將于2007年1月1日正式上線,新版本將憑借其自主研發(fā)的服務(wù)器集群并行的抓取技術(shù),成為全球首個中文網(wǎng)站收錄量達到100億的搜索引擎,并以每天5億網(wǎng)頁的更新速度及獨一無二的搜狗網(wǎng)頁評級體系,在海量、及時、精準(zhǔn)等搜索引擎基本指標(biāo)上全面升級中文搜索引擎的用戶體驗,再次掀起搜索引擎新一輪技術(shù)革命。

     海量:全球首個網(wǎng)頁收錄量達到100億的中文搜索引擎

  一直致力于后臺技術(shù)研發(fā)和數(shù)據(jù)積累的搜狗,在2006年8月份的時候就成功支持了50億中文網(wǎng)頁的查詢,成為了全球首個中文網(wǎng)頁收錄量達到50億的搜索引擎,即將于2007年1月1日震撼上線的搜狗網(wǎng)頁搜索3.0更是將數(shù)據(jù)量拓展到了100億的驚人數(shù)字,再創(chuàng)全球中文網(wǎng)頁收錄量新高。

  目前市場上各家搜索引擎對于中文數(shù)據(jù)的收錄量遠比英文數(shù)據(jù)的收錄量低很多,導(dǎo)致了用戶想要的信息找不到,這也是長期以來中文搜索引擎的用戶滿意度要比英文的低很多的一個主要原因,而數(shù)據(jù)量的大小,直接反映了搜索引擎研發(fā)團隊的技術(shù)實力。

  此次,搜狗技術(shù)團隊采用了自行開發(fā)的文件系統(tǒng)和數(shù)據(jù)庫,大幅提升了服務(wù)器利用率,并對后臺的抓取、頁面分析、濾重、索引、排序、反垃圾等一系列的功能模塊都進行全方位的升級,以支持更大的容量的內(nèi)容儲備,向網(wǎng)友提供創(chuàng)紀(jì)錄的百億網(wǎng)頁的信息資源,進一步拉開了與競爭對手的差距,重新定義了搜索引擎業(yè)界標(biāo)準(zhǔn),奠定了搜狗技術(shù)團隊行業(yè)絕對領(lǐng)先的地位。

  及時:每天更新5億網(wǎng)頁,最新資訊最快1分鐘即可被檢索到

  在及時性方面,搜狗網(wǎng)頁搜索3.0通過智能分析技術(shù),對于不同網(wǎng)站、網(wǎng)頁采取了差異化的抓取策略,充分地利用了帶寬資源來抓取高時效性信息,更是確保互聯(lián)網(wǎng)上的最新資訊能夠被用戶及時檢索到。

  經(jīng)過對互聯(lián)網(wǎng)上的熱點新聞事件搜索的測試,搜狗網(wǎng)頁搜索3.0僅需1分鐘時間就能完成從抓取到頁面分析到建立索引到上線的全部過程,在第一時間呈現(xiàn)大量相關(guān)結(jié)果。在這樣的速度下,每天搜狗的服務(wù)器集群并行更新5億的網(wǎng)頁,用戶不必再專門到新聞搜索引擎上,就能獲得最新資訊。

  為了滿足對及時性要求極高的用戶的需求,搜狗還特意提供了按時間排序的功能,更加顯示了搜狗網(wǎng)頁搜索3.0強大的網(wǎng)頁及時迅速的更新能力。

  精準(zhǔn):評測指標(biāo)業(yè)內(nèi)領(lǐng)先 基于搜狗網(wǎng)頁評級的結(jié)果排序

  搜索結(jié)果的精準(zhǔn)性是搜狗網(wǎng)頁搜索3.0三大特點之一。搜狗網(wǎng)頁搜索3.0在搜索結(jié)果的排名上采用了被業(yè)界廣泛認可的搜狗網(wǎng)頁評級體系。網(wǎng)頁評級是搜狗衡量網(wǎng)頁重要性的指標(biāo),不僅考察了網(wǎng)頁之間鏈接關(guān)系,同時考察了鏈接質(zhì)量、鏈接之間的相關(guān)性等特性,網(wǎng)頁評級越高,該網(wǎng)頁在搜索中越容易被檢索到。由于有了網(wǎng)頁評級體系的保證,搜狗的搜索結(jié)果能夠做到更加精準(zhǔn)。

  另外,用戶對于搜索結(jié)果的點擊,代表了用戶對搜索結(jié)果的認可。數(shù)據(jù)分析表明,用戶每次搜索后,點擊結(jié)果的次數(shù)越多,說明搜索結(jié)果越精準(zhǔn)。搜狗網(wǎng)頁搜索3.0從用戶體驗出發(fā),將結(jié)果點擊次數(shù)與搜索次數(shù)的比率,即點擊通過率,作為評估搜索結(jié)果精準(zhǔn)性的重要指標(biāo),進行優(yōu)化,確保我們的算法滿足用戶對于“精準(zhǔn)”的理解。搜狗網(wǎng)頁搜索3.0版本上線后,網(wǎng)頁搜索的點擊通過率預(yù)計將提升了10%。

  由于Web2.0概念的普及,博客、論壇、社區(qū)、圈子等應(yīng)用的涌現(xiàn),互聯(lián)網(wǎng)上越來越多的用戶從信息的獲取者變成了信息的發(fā)布者。面對求知若渴的眾多網(wǎng)友,目前國內(nèi)搜索引擎市場遠遠達不到用戶對海量、及時、精準(zhǔn)的三點要求,導(dǎo)致目前國內(nèi)搜索行業(yè)處于停滯不前,利益當(dāng)先的狀況,因此搜狗網(wǎng)頁搜索3.0的誕生是對目前龍魚混雜的搜索市場的一次梳理,也是長期以來的嘗試和發(fā)展過程中勇于創(chuàng)新的成果,必將打破目前搜索行業(yè)的陳舊格局,成為2007年搜索風(fēng)暴的引領(lǐng)者。

  搜狐公司董事局主席兼首席執(zhí)行官張朝陽先生非常有信心地說:“在信息呈現(xiàn)爆炸式增長的今天,海量、及時和精準(zhǔn)已經(jīng)成為搜索引擎的衡量標(biāo)準(zhǔn)。搜狗網(wǎng)頁搜索3.0將會成為中文互聯(lián)網(wǎng)中品質(zhì)最好的搜索引擎。搜狗技術(shù)研發(fā)團隊近兩年的技術(shù)儲備,將為搜索領(lǐng)域帶來深刻的蛻變。2007年1月1日,搜狗網(wǎng)頁搜索3.0正式發(fā)布,將會證明一切,我們期待那個時刻的到來,同時也是給一直以來支持搜狗的網(wǎng)友們一份新年大禮,我們將同網(wǎng)友一同見證這個在搜索行業(yè)標(biāo)入史冊的重要時刻”。

  從誕生之日起,為網(wǎng)民提供最好的互聯(lián)網(wǎng)體驗就是搜狗團隊一直不懈努力的目標(biāo),從憑借打字速度快而火速竄紅的搜狗輸入法到中文網(wǎng)頁評級最權(quán)威的行業(yè)標(biāo)準(zhǔn)Sogou Rank;從運用領(lǐng)先的pxp技術(shù)提供流暢的在線音樂試聽到為網(wǎng)民提供了無限樂趣的文品指數(shù),以及國內(nèi)首個搜索引擎實驗室——搜狗網(wǎng)絡(luò)實驗室,都證實了搜狗的強大技術(shù)創(chuàng)新能力。【來源:搜狐IT】

    搜狗網(wǎng)頁搜索3.0版本介紹
   
張朝陽:百度的技術(shù)人員搜狗看不上
 

搜索愛好者論壇>>

 相關(guān):

Copyright ©  2006 SoWang.com All rights reserved. 
中文搜索引擎指南網(wǎng)