首頁>>搜索技巧

 

搜索者容易犯的七個低級錯誤

   搜索引擎9238 原作 2001-06

這里描述了菜鳥們搜索時容易犯的七個低級錯誤,正是因為你經(jīng)常犯這些錯誤,所以你總是得到無用的、荒謬的或者完全沒有意義的搜索結(jié)果。而一旦你認識到這些錯誤,將很容易把這些小鬼從你的搜索工具箱中永遠驅(qū)逐出去。

 

1:停用詞Sputtering on "Stop Words"

==========================

一些搜索引擎會忽略這些詞,當你把停用詞輸入搜索框時,不管網(wǎng)上有多少數(shù)量的相關(guān)文件,它們一個都不會找回來給你。

 這些被叫做停用詞stop words),因為搜索引擎在它的數(shù)據(jù)庫里碰到這些詞時不會搜索。

為什么不搜么?因為停用詞可能太常見了以至于無法搜索出有意義的結(jié)果,或者是語言中的副詞、連詞、介詞,或者是"be" 的變體如is、are、were、been等無意義的詞,除非它們在一個短語中且有重要的名詞和動詞相伴。

 

如果你在一個搜索請求中使用了停用詞,那么你得到大量毫不相關(guān)的搜索結(jié)果。比如,短語"searching the Web" 包含了兩個停用詞,"the" 和 "Web"。雖然這還不算特別常見的詞匯,但Web 在網(wǎng)絡(luò)上實在是太常見了,使它事實上不能幫你搜索到什么有用的內(nèi)容。

 

如果去掉停用詞,"searching the Web" 變成 "searching",這個關(guān)鍵詞帶給你的搜索結(jié)果會從搜索一個逃犯直到尋求啟蒙。(quests for enlightenment)如果你夠幸運,當然也會得到一些關(guān)于searching the Web的搜索結(jié)果。

 

怎樣辨別停用詞呢?300個最常用的英文詞匯基本上都是停用詞,搜索引擎google在你的搜索關(guān)鍵詞中含有停用詞時,會把它忽略的每個停用詞告訴你,就顯示在搜索結(jié)果頁最上邊。你可以用一個含停用詞 "web" 的關(guān)鍵詞試一下。

 

2:布爾操作符Bungling with Boolean

========================

布爾操作符,象and、or 和not,能夠使你的搜索結(jié)果更精確——如果使用正確的話。

問題在于布爾操作符看上去太簡單了,似乎非常容易使用,這真的可能是一種誤解。

 

按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的說法, 各種搜索引擎對布爾符都有自己的支持方法,并非完全相同。比如,同樣一種效果,有的搜索引擎只要用"not",有的搜索引擎卻要用"and not"才能達到。而且,有些搜索引擎要求布爾符必須是大寫的,另一些就沒有這種要求。

 

如果你真的想使用布爾符,請認真學(xué)習(xí)它的使用方法。

 

 

3:普通詞Being Ever So Vulgar

=====================

Vulgar來自拉丁語vulgus, 意思是普通。象一些有教養(yǎng)的詭辯家,搜索引擎對普通詞的搜索存在缺陷。不是因為它們妄自尊大或自命不凡。而是因為這些詞太常見了,以至于出現(xiàn)在成百萬上千萬的網(wǎng)頁中,使得它們事實上不能被用來幫你找到什么有用的內(nèi)容。

 

比如說weather, 有成千上萬的網(wǎng)站提供跟weather相關(guān)的信息,從地方天氣預(yù)報到學(xué)術(shù)論文到氣象學(xué),

所以使用更多的關(guān)鍵詞或更明確的關(guān)鍵詞來搜索要比單單搜索"weather"好得多。 設(shè)計一個類似 "Cicely Alaska annual snowfall"這樣特殊的搜索關(guān)鍵詞,會給你真正有用的結(jié)果。

 

 

4:尋找玫瑰,Looking for a Rose, By Any Other Name

======================================

要小心使用多義詞。 Kris Carpenter是Excite 的搜索服務(wù)主管,舉了"bond" 作為例子。我們不得不問自己,他們在找的信息是關(guān)于金融公債的、化學(xué)粘合劑的、還是大名鼎鼎的007邦德的?

最好的解決辦法是,在搜索引擎之前先問自己這個問題,然后用短語代替多義單詞作為關(guān)鍵詞。

 

搜索引擎也很容易被同拼法異音異義的詞迷惑,比如 "lead" ,發(fā)音LEED的時候, 意思是領(lǐng)導(dǎo),發(fā)音LED的時候指的是一種金屬元素。

 

如果可以,盡可能使用意義明確的同義詞代替同拼法異音異義的字。例子可以看The Heteronym Home Page.

 

 

5:大寫字母Committing Capital Offenses

===========================

搜索者的另一個問題是要不要在關(guān)鍵詞中使用大寫字母。

有的搜索引擎是區(qū)分大小寫的,但也有搜索引擎是不分大小寫的。

憑經(jīng)驗來說,總是使用小寫字母搜索是個好主意。

這樣搜索,會得到所有包含你的搜索關(guān)鍵詞的網(wǎng)頁,不管其中的關(guān)鍵詞首字母大寫還是小寫。

 

如果你在搜索關(guān)鍵詞中使用大寫字母,那么搜索引擎返回的結(jié)果將只有一種,其網(wǎng)頁中含有大小寫跟你的搜索關(guān)鍵詞完全相同的單詞。

象人名和地名之類關(guān)鍵詞使用大寫字母是個好選擇,但是其它對大小寫沒那么敏感的單詞,如果也使用大寫字母,可能使你錯過很多有用的網(wǎng)頁。

 

如果想知道哪個搜索引擎對大寫敏感,以及如何處理大小寫字母,就對Danny Sullivan的網(wǎng)站Search Engine Watch上的Search Engines And Capitalization花點時間吧。

 

 

6:Close, But No Cigar

=====================

多數(shù)搜索引擎對于 "Kosovo refugees" 或 "space shuttle missions" 這樣的短語搜索效果很好。然而,當你使用類似這一節(jié)的標題的短語Close, But No Cigar進行搜索時,就遇到問題了。 在一個主流搜索引擎中搜索"close but no cigar",得到的第二條結(jié)果是:The Common Cold: Relief But No Cure. Definitely no cigar!

 

兩個關(guān)鍵詞之間的距離稱為接近程度。 當你的搜索關(guān)鍵詞們分散在一個網(wǎng)頁的不同位置時,有些搜索引擎會給你一個積極的結(jié)果,不管它們是否彼此靠近,還是位于同一個短語中。

 

如果你希望你用的搜索關(guān)鍵詞們在搜索到的內(nèi)容里互相靠近,那么你的最好選擇是AltaVista 和Lycos, AltaVista 它允許你使用 NEAR 這個操作符號,而 Lycos 的高級搜索提供了多種設(shè)置關(guān)鍵詞接近程度的可能。

 

 

好,現(xiàn)在說最容易犯的那個搜索錯誤

 

7:在錯誤的地方搜索Searching for Hits in all the Wrong Places

===========================================

在你決定找某種內(nèi)容之前,先確認你對這次搜索任務(wù)使用了正確的工具。各種搜索引擎在搜索范圍、功能和質(zhì)量方面大相徑庭,如果沒有為你的每次搜索分別選擇正確的搜索工具,你將浪費自己大量的時間。

 

你應(yīng)該使用Excite 還是HotBot? AltaVista 還是 InfoSpace? 分析你的需求,比較不同搜索引擎的強項和弱點,然后選擇最適合這次搜索任務(wù)的搜索工具。

 

如果你真的遇到怎么也搜索不到,那也不要太過苛求自己。我所聽過的最荒謬可笑的說法是:你能在ingternet上找到任何東西。這就象在說,你能在每一個煤礦里都找到鉆石。

 

也許聽上去有點異端邪說的味道,但是有個網(wǎng)絡(luò)搜索指南確實說過,有時你能選擇的最好搜索方法是放棄搜索,跑一趟附近的圖書館。圖書館里網(wǎng)上找不到的成噸的信息資源。而且圖書館員一般是受過訓(xùn)練的的專家,它們通常會很樂意幫你找東西。當你在網(wǎng)上無處可去的時候,試一下真正的人工智能搜索引擎吧,你會發(fā)現(xiàn)它們真的非常優(yōu)秀 。

 

 

讓錯誤走開Begone, Mistakes!

====================

在你逐漸獲得網(wǎng)絡(luò)搜索經(jīng)驗的過程中,避免這七個常見的搜索錯誤將成為一種自然而然的習(xí)慣。無論何時,當你得到意料之外和怪異的搜索結(jié)果時,記得檢查一下你用的搜索關(guān)鍵詞,弄明白發(fā)生了什么事。你可能發(fā)現(xiàn)又一個自己需要避免的搜索錯誤。

 

 

4月中譯于about,原文中錯誤與過時之處不在少數(shù),未作糾正,僅供參考,切勿全信  


Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南網(wǎng)  版權(quán)所有