2003年8月20日,慧聰國際軟件和中國網在北京國賓酒店召開主題為“搜索的智慧”新聞發布會,宣布正式推出第三代智能中文搜索引擎(www.huicong.com)。
會議現場,國內著名的搜索引擎專家,慧聰國際軟件CEO陳沛向與會者系統地闡述了慧聰第三代智能搜索引擎的技術特點與優勢。該搜索引擎首次將自動分類技術、中文內容分析技術及區域識別技術應用到大型搜索引擎中,其中文網頁覆蓋率已超過2億頁。除了在信息檢索速度、更新頻率等基本技術指標方面處于領先地位外,它的網頁相關檢索、拼音糾錯、模糊查詢、口音查詢技術也具有很高的水準。此外,還同時推出了MP3、圖片、FLASH搜索功能,已成為能夠提供全面、綜合的信息搜索服務的技術提供商。
慧聰一直在致力于研發最優秀的中文搜索引擎,并在技術上取得了豐碩的成果。在這次新聞發布會上慧聰正式宣布國內著名的門戶網站——搜狐、網易、TOM已全面采用慧聰第三代搜索引擎。慧聰搜索自去年正式推出就為新浪提供新聞搜索服務,并相繼為3721、中華網、263等門戶網站提供搜索引擎技術。
慧聰第三代智能搜索引擎的特點與優勢
慧聰搜索引擎之所以能成為眾多大型門戶網站的首選,得益于長期以來在中文搜索技術開發方面的不懈努力。慧聰搜索引擎所追求的服務境界已不僅限于滿足用戶“多、快、準”的信息檢索需求,而是“讓搜索更具智慧”,就是不斷提高中文搜索技術的智能化水平,讓搜索引擎更合乎漢語特點和中國人的搜索習慣。具體特點則主要體現在以下幾方面:
1、網頁覆蓋率高、網頁更新頻率快
慧聰搜索引擎所覆蓋的中文網頁的總量超過2億,是目前最大的中文搜索引擎。因為搜索引擎的檢索服務主要是針對網頁的檢索,網頁覆蓋率是評估搜索引擎的一個重要指標。目前全球每秒鐘就有50多個新的網頁推出,網頁總數已達到30億左右,中國網站總數為371600個。面對如此浩瀚的信息海洋,慧聰搜索引擎每十天更新一次網頁數據庫,每十分鐘更新一次新聞內容,是目前全球數據更新頻率最高的中文搜索引擎。
2、搜索功能的多樣化
用戶對搜索引擎的使用需求已不是敲幾個關鍵字就能滿足的了,而是要求搜索引擎能更好地領悟使用者的搜索意圖,但同時又不能增加搜索的復雜性。慧聰第三代智能搜索引擎除了提高對關鍵字的理解水平外,還針對用戶應用較多的搜索請求,增加了如下更便捷的功能模塊,取代了關鍵字的復雜匹配:
-廣泛的地域搜索
您是否還用“鮮花店+北京”的方式來搜索北京地區的鮮花店?這樣的結果可能是相對準確的,也可能只是一篇發表在外地(上海或其他地方)包含了北京和鮮花店這兩個關鍵字的文章。而慧聰搜索引擎的地域搜索能讓您完全跨越區域性的障礙,只提供您想看到的地區的詳實信息。
-強大的行業搜索
同名同姓的高比率是我國身份驗證工作的一大障礙,而在互聯網中也造成了一定的麻煩。您可能會在搜索引擎的結果中發現幾十個甚至上百個不同身份的“王濤”、“蔡國慶”、“小剛”……。通過慧聰第三代智能的行業分類功能,讓您搜所到“專門從事乒乓球運動的王濤”,而不是其他叫王濤的人。
-完美的MP3搜索
慧聰搜索引擎能在同時將歌曲下載地址、歌手資料、新聞、歌詞的信息以最簡單、直觀的方式展示給您,并且提供您最快的下載路徑。沒有了二次搜索麻煩,沒有了“該頁無法顯示”的苦惱。體現了慧聰搜索引擎最體貼的設計。
除了上述功能模塊外,慧聰搜索引擎還不失時機地推出了圖片和FLASH搜索,不斷地完善針對用戶個性化的服務。
3、針對內容的相關性查詢
慧聰搜索引擎的智能化特性最大的體現。在準確地提供您想搜索的內容外,還提供與該內容密切相關的其他信息檢索。比如:當您在搜索“防治流感”時,除了給出關于“防治流感”的信息外,還會同時提供有關流感的最新新聞、流感的常識、流感疫苗的基本知識等檢索內容,這決不是簡單的關鍵字匹配,而是基于對內容進行認真的分析和對漢語內涵的精確理解,只有使用中文進行溝通的人才能真正體會到的便利。
4、符合漢語特性的模糊查詢
當您想搜索“謝霆峰”但不知到如何正確拼寫時,利用慧聰搜索引擎,您只需輸入“寫聽風”(或其他同音不同意的漢字)就可以搜索到關于“謝霆峰”的正確信息。如果您無法區分拼音中“ZHI、CHI、SHI”的不同,也沒關系,只要您正確地輸入漢語拼音的第一個字母(如“謝霆峰=XTF”),照樣可以搜到準確的信息。天南海北的口音不再是障礙,因為我們都使用同一種語言——漢語,更因為慧聰搜索引擎具有強大的拼音糾錯與模糊查詢的功能。