目錄
前言
1.信息太少或找不到
1.1錯別字
1.2 不合理的關鍵字
1.3 沒有最新信息
1.4 信息采集不夠
2.檢索結果相關性差
2.1 動態分類
2.2 綜合搜索
2.3 重復信息
2.4 摘要顯示影響感覺上的相關性
2.5 中文切詞
2.6人工指定部分搜索結果
2.7 網站直達
2.8 相關性算法
2.9 收集用戶反饋
3.死鏈接
3.1 網頁快照
3.2 網頁即時預覽
3.3 搜索結果自動播放
4.速度慢
4.1 檢索速度慢
4.2 搜索結果網頁打開速度慢
5.用戶支持
5.1 ilor
5.2 搜索專題:
5.3 相關搜索
5.4 toolbar,瀏覽器 button,地址欄搜索插件
5.5 類似網頁
5.6 網站直達功能
5.7 提供高級檢索界面
5.8 開放高級搜索語法
5.9 個性化設置(preference)
5.10 搜索結果排序方式可選
5.11 email訂閱搜索結果
5.12 翻譯其它語言搜索結果
5.13 允許選用其它搜索引擎
5.14用戶交流
5.15 關鍵詞
=============================================
前 言
=============================================
以我的使用經驗,用戶在使用搜索引擎方面,最不滿的5個問題是:
1. 信息太少或找不到
2. 檢索結果相關性差
3. 死鏈接
4. 速度慢
5. 用戶支持不夠
以下從一個普通用戶的角度,簡單總結了產生這些問題的可能原因,以及針對這些問題的一些已知解決方法,都是有的搜索引擎做過的。
=============================================
1.信息太少或找不到
=============================================
用戶使用搜索引擎找到的信息太少或找不到的原因,主要是
1.1錯別字
1.2不合理的關鍵字
1.3沒有最新信息
1.4信息采集不夠
◆◆1.1錯別字:
(用戶對所找主題不熟悉、同音字、網絡通假字泛濫等各種原因導致的錯誤關鍵詞很多,但用戶很難自己發現自己輸了錯別字,只會怪搜索引擎找不到信息。多個搜索引擎有針對錯別字的解決方案。)
--Yahoo
Yahoo的做法也是給出用戶正常搜索關鍵詞,但提示可能更正確的關鍵詞。如搜索“britny spear”,yahoo會提示Other Spellings: Try searching for britney spear instead。但yahoo的辨別率較低,而且中文雅虎不支持。
--Directhit和NBCi
Directhit的做法是,給用戶正常搜索結果,但在“相關搜索”中給出一個可能更正確的關鍵詞。
使用overture之前的NBCi也是這種做法。
--google
Google在給用戶正常搜索結果的同時,把可能更正確的關鍵詞顯示在搜索結果頁頂端,用“你要找的會不會是:”來表示。如用戶搜索“chrismas”,會得到“chrismas”的搜索結果和“你要找的會不會是:chrismas”
--excite
excite的Zoom In曾有檢查拼寫錯誤的功能。正確單詞會出現在Zoom In中,后邊跟(sp)表示。
--MSN
msn采取主動更正錯誤的方式,用戶搜索“britny spear”,會得到改正后的“britney spear”的搜索結果。
--Ask Jeeves
Ask Jeeves也是在背后主動改正用戶的拼寫錯誤。比如用戶搜索"speling" ,Ask會自動搜索 "spelling"。
--openfind和3721
openfind曾提供模糊檢索,支持同音、容錯,但現在已撤下。
3721的南方音和同音搜索部分解決了用戶拼音不好導致的錯別字。
◆◆1.2 不合理的關鍵字:
(用戶缺乏搜索常識,不懂使用合理的關鍵詞組合,也是找不到信息的原因之一。)
--黃反屏蔽:
有些用戶不知道部分搜索引擎會屏蔽黃色和反動詞,以為搜索引擎找不到信息。
--自然語言搜索:
(一些搜索引擎向用戶提供不同程度的模糊檢索或自然語言檢索功能,有助于解決用戶不懂使用合理關鍵詞組合的問題。)
-Openfind:曾經支持簡單的模糊檢索。
-askjeeves:憑龐大的問題庫來支持自然提問搜索。
-iphrase:基于語義庫的自然語言檢索。
-webtop和kenjin:可以用整段文章或整篇網頁檢索,現在均已關閉。
--推廣搜索常識
(推廣搜索常識,可以提高用戶水平,減少這種錯誤,并培養忠實用戶)
-好的搜索幫助文檔:某些搜索引擎的搜索幫助寫得很好。
-提示搜索技巧:
263、fm365曾在搜索頻道首頁經常提示搜索技巧;
google有時利用搜索結果頁提示搜索小常識。
-搜索有獎比賽:新浪、賽迪的兩種搜索有獎比賽
-電視宣傳:
年初新浪在北京臺的電視宣傳
近期百度在教育臺的電視宣傳
-出搜索書籍:
Altavista出過一本“The Altavista Search Revolution”,當時曾有不小的影響。
“我是野虎”搜索引擎出過一本書。
-媒體文章:略
-搜索論壇:新浪搜索論壇效果顯著。
--Fast(alltheweb)
Fast的“pre-analysis”功能可以給用戶輸入的關鍵詞自動加雙引號進行詞組檢索
支持自動辨別長關鍵詞串中的重要單詞、刪除"noise" words再檢索,該功能是默認的,但可在高級設置中關掉。
--Altavista,
(Altavita認為:當用戶輸入2-4個詞時,他們通常在找包含所有單詞的文件,但是,當5個以上的關鍵詞,包含多個概念時,用戶經常是處于'find stuff like what I describe here',即“找一些我描述的這樣的文件”的狀態,這種情況下,他們并非要求搜索到的文件必須包含所有他輸入的單詞。)
-對于2-4個單詞的關鍵詞,altavsta會從一個大約500,000的短語詞典中尋找,如果符合其中的某條短語,就把你的關鍵詞自動當作短語來搜索,但也會返回含有所有單字的網頁。
-對于5個或更多單詞的關鍵詞,altavista會先尋找符合條件的短語,也會尋找包含部分單詞的網頁。
◆◆1.3 沒有最新信息:
(搜索引擎抓取和索引大數量級網頁需要時間,因此存在信息滯后性。但用戶不懂這原理,大量的用戶用搜索引擎尋找新聞尤其是突發事件,一些搜索引擎采用綜合搜索或對部分網頁快速更新的方法初步解決了這個問題。)
--Fast(alltheweb)
-在傳統搜索結果前加最多2條即時新聞,并提供“more news articles”的鏈接。
-提供獨立的新聞搜索,對3000多個新聞網站建立快速索引,最快可檢索到1分鐘前的新聞。
--inktomi
-對它約1億的高權值網頁庫提高索引更新頻率(每9天),付費登錄網頁支持最快每天更新。
--新浪
-綜合搜索中含有新浪自己的新聞搜索,并有“更多”鏈接,指向獨立的新聞檢索。
--雅虎
-改版后的雅虎在傳統搜索結果后加上最多3條自己的新聞標題搜索,并有“更多”鏈接。
--google
-在傳統搜索結果前加最多4條新聞,搜自著名新聞網站(英文)。
-對320萬權值高或更新頻率高的網頁每天更新一遍索引。
-提供一個新聞資源鏈接網頁,提供一個新聞入口網頁列出分主題的當天重要新聞。
◆◆1.4 信息采集不夠
(這是一個長期存在,需要長期努力的問題)
--支持更多網頁類型:
frame,redirect,java,動態網頁,利用linkanalysis部分索引,各種文字和符號組合的辨別索引
--支持更多文件格式:
wkx,mw,xls,flash,pdf,ppt,ps,doc,rtf ,doc,圖象,視頻,音頻……
--提高網頁庫質量:
去重,減少死鏈接,優化網頁選擇策略
--及時更新:
同1.3
--增大網頁庫數量級:
=============================================
2.檢索結果相關性差
=============================================
◆◆2.1 動態分類
(使用同一個關鍵詞搜索,不同用戶需求的信息是不同的,比如“石器時代”,他找的是歷史相關信息?游戲相關信息?如果是游戲相關信息,他找的又是同名網站?官方網站?戰網?游戲介紹?買游戲產品?游戲新聞?攻略?但搜索引擎通常只把一類信息排在前,導致其它信息搜索者認為相關性差。隨著網頁數量的迅速增長,這問題會更嚴重,搜索結果動態分類有助于這個“用戶信息需求多元化”的問題。)
--northernlight
人工預設目錄結合自動歸類
--queryserver、vivisimo
主要利用結果摘要提取關鍵詞歸類
--teoma
利用超鏈分析對結果網頁歸類
--fast
利用dmoz分類目錄結合自動歸類
--znow
利用詳細的預設目錄歸類
--Guidebeam
對搜索結果網頁分析歸類
――oingo
利用語義庫分類
◆◆2.2 綜合搜索
(用戶搜索一次,同時看到跟該關鍵詞相關的多種信息,也有助于改善上邊提到的用戶信息需求多元化的問題)
--sina:一次提供目錄、網站、網頁、新聞、商品等多種搜索結果。
--britannica:一次搜索,同時顯示產品、書籍、網站、百科全書、雜志、錄音帶等的搜索結果。
--google:提供字典、分類目錄、新聞、股票、電話、地圖搜索等,根據關鍵字顯示不同內容。
◆◆2.3 重復信息
--不同網址的相同內容引起的重復
百度:內容類聚
--網站互相抄襲引起的內容重復
Google:相似內容類聚
◆◆2.4 摘要顯示影響感覺上的相關性
--動態摘要:
Google:動態摘要使搜索結果看上去更相關。
(注:2002年3月,百度已升級為動態摘要)
--結合分類目錄摘要:
-google對搜索結果中被dmoz收錄的網頁,加上了dmoz人工編輯的網站摘要,與動態摘要并存。
-openfind利用藍帆的分類目錄給出部分網頁搜索結果的摘要。
--網頁截圖
girafa、searchshots除文字摘要外還提供一張網頁截圖,用戶得到視覺化摘要,更易辨別選擇搜索結果。
◆◆2.5 中文切詞
(中文切詞不準使搜索結果相關性差,是一個長期的、漸進的問題)
--百度的人名中文切詞專利
◆◆2.6人工指定部分搜索結果
(人總比電腦更理解人的需求)
--有些搜索引擎對熱門關鍵詞的搜索結果作過人工干預,所以這些詞的檢索結果相關性比其它自動生成的要好。
◆◆2.7 網站直達
--overture的Quick Hit
overture的排名誰都可以買,但很多用戶檢索“yahoo”“aol”等網站名時是想上那個網站,因此,overture對這種有官方網站的關鍵字,在檢索結果前增加了一條“Quick Hit”,用戶點擊后可直達官方網站。
--msn的realname
分類目錄的信息量小,檢索結果的相關性無法跟網頁檢索一樣靠算法提高,所以msn在分類目錄搜索結果前,使用了realname,使搜索網站名的用戶可以直達相關網站。
--aol
aol在分類目錄搜索結果前,用recommended sites 的形式提供官方網站鏈接。,
◆◆2.8 相關性算法
--超鏈分析的提升(Link popularity、anchortext、context)
超鏈分析先天缺陷:使小站、新站、專業站處于不利地位。一個專業小網站,它的內容再好,因為不能迅速得到大量高質量的超鏈,難以得到合適的排名。
--內容分析的提升
--User popularity
(有些搜索引擎利用用戶傾向統計來排序)
-directhit:按搜索結果點擊率及網站停留時間排序
-hotlinks、blink:收集用戶收藏夾按網站被收藏率排序
-top9:根據網站訪問人數排序
-google:曾分析約1成的搜索結果點擊,據以調整相關性算法。利用advanced toolbar收集用戶訪問習慣作分析
◆◆2.9 收集用戶反饋
--overture、britannica
它們在每個搜索結果頁上放了一個浮動調查,讓用戶以“――、-、+-、+、++”5檔評選當前搜索結果的相關性,然后根據統計結果,及時研究和改善受到劣評的搜索結果頁。
--google
英文版允許用戶對當前搜索結果頁發表意見。有5個意見選項可選擇:Off-topic、Offensive、Described poorly、Too similar to one another、The page I was looking for wasn't listed in the results,另外,用戶可寫上正在尋找的url或描述想找的內容。在Google的新版toolbar也提供了相似的搜索結果用戶投票功能。
=============================================
3.死鏈接
=============================================
◆◆3.1 網頁快照
--Alexa、google、daypop等搜索引擎有應用
◆◆3.2 網頁即時預覽
--vivisimo、wisenut:
點擊一條搜索結果鏈接后,在當前窗口中開一個frame,預覽該網頁。可減少用戶從死鏈接受到的挫折。
◆◆3.3 搜索結果自動播放
--metacrawler、metor、robocast:
用戶搜索后,如果選擇自動播放,可以看到搜索結果網頁一個一個的輪流打開,可設定每個網頁停留時間、可隨時打開新窗口、可選定幾個網站后打開自動播放。省去了用戶不斷點擊的麻煩。
=============================================
4.速度慢
=============================================
◆◆4.1 檢索速度慢
--利用cache
◆◆4.2 搜索結果網頁打開速度慢
--簡化網頁設計
--加快網頁傳輸
=============================================
5.用戶支持
=============================================
◆◆5.1 ilor
(在ilor檢索后,用戶把鼠標移到搜索結果鏈接上后,鼠標旁出現4個選項)
--go now-anchor here:
打開該項結果,并用浮動小窗口記錄該結果的位置,任何時刻點一下浮動小窗口就可回來,省去經常按后退的麻煩。可打開多個anchor。
--onpen in new window :
在新窗口中打開并顯示此項搜索結果,
--open in background:
新窗口中打開,但顯示在當前窗口背后,以免影響當前窗口視線。
--put in my list:
在彈出的浮動小窗口中收藏本鏈接,以便其它時間再看。可收藏多個鏈接。
◆◆5.2 搜索專題:
(人工制作一個介紹某領域優秀網站和搜索常識的專題,對用戶頗具幫助)
--About:700多個搜索專題
--Northernlight:26個Special Editions
--263搜索:游戲、性愛、mp3、教師節、桌面等搜索專題
◆◆5.3 相關搜索
--baidu、altavista、webtop、nbci的相關搜索
――excite的zoom in
――askjeeves的相關問題
◆◆5.4 toolbar,瀏覽器 button,地址欄搜索插件
--toolbar:google、openfind
--瀏覽器button:google
--地址欄搜索插件:3721
◆◆5.5 類似網頁
――alexa:為alexabar、ie、netscape提供的相關網站功能
--teoma:Experts’ link 也具有尋找同類網頁的功能
--google:類似網頁
◆◆5.6 網站直達功能
--手氣不錯
◆◆5.7 提供高級檢索界面
--略
◆◆5.8 開放高級搜索語法
--站內搜索、標題搜索、短語檢索、時間限制、inurl較常用
◆◆5.9 個性化設置(preference)
--允許用戶自己設定并記憶搜索引擎設置:fast、altavista、wisenut、google
◆◆5.10 搜索結果排序方式可選
--zeal、nbci的分類目錄搜索,曾經可選擇按照relevance、new、popular、link任一規則排序。
--northernlight可按時間排序。
◆◆5.11 email訂閱搜索結果
--profusion、northernlight:
訂閱指定關鍵字的搜索結果,有更新的搜索結果會自動email發送。
◆◆5.12 翻譯其它語言搜索結果
--altavista、google:提供對搜索結果的翻譯
◆◆5.13 允許選用其它搜索引擎
--yahoo、google、ask:在搜索結果頁上提供其它搜索引擎的鏈接,用戶點擊后,調用其它搜索引擎檢索當前關鍵詞。
◆◆5.14用戶交流
--節日問候
--專用email、論壇、反饋提交入口
--提供免費提交網頁入口、及robot.txt教學文檔
◆◆5.15 關鍵詞
--yahoo、google:定期展示熱門關鍵詞統計結果
--chinaren、21cn:曾滾動顯示其它用戶當前搜索關鍵詞
|