首頁>>搜索查詢網站登陸技巧

 

搜索引擎從入門到精通之三 使用技巧篇

2001-12-08

文/陸元婕 

“美美,問題列出來了嗎?”
“嗯,給你看吧。大部分都不是我想要找的。搜索引擎還是不好用。”
“美美,別急,會有辦法的,我們一起來找找看。”

司坦福大學——用Google、新浪都沒找到與之相符的網頁
歌星王菲 精選專輯 -rm——用新浪和Google都沒找到有價值的結果
世界杯預選賽 最新新聞——用Google找的都是舊聞。用新浪倒是找到了一些,可是點擊過去一看鏈接的不對啊。
大連 天津街 地圖——用Google、新浪都查不到有用的信息。
IT 新聞——在Google中給出的都只是新聞,而沒有IT業的新聞。不過新浪倒是不錯,有相關的新聞。

看到美美的這張問題列表,小張和妮妮私下研究了一會。

“這些其實不難找。先讓小張給你介紹一些基本的搜索技巧吧。然后我們再實戰演練幾番。”

“好啊,真的能很快就學會搜索嗎?我會努力的。現在開始吧……”

一、選擇合適的搜索工具
“每種搜索引擎都有不同的特點,只有選擇合適的搜索工具才能得到最佳的結果。之前已經介紹過了搜索工具基本上可以分為網頁檢索(也就是上次說的基于蜘蛛程序的機器人檢索系統)和分類目錄(即目錄式搜索引擎)兩種(我們先不談元搜索引擎)。”
“網頁檢索實際上是網頁的完全索引。分類目錄則是由人工編輯整理的網站的鏈接。”
“這兩種搜索工具哪種好用呢?”

“這取決于你想查詢的問題。一般來說,如果你需要查找非常具體或者特殊的問題,用網頁檢索比較合適;如果你希望瀏覽某方面的信息、專題或者查找某個具體的網站,分類目錄會更合適。”

“要是你需要查找的是某些確定的信息,比如Mp3、地圖等,就最好使用專門的Mp3、地圖等搜索引擎。”

“有這樣的專業搜索引擎嗎?”

“當然,實際上幾乎每一類信息都有非常專業的搜索工具,它們有個名稱叫垂直搜索引擎。比如賽迪網的IT羅盤就是以精選式IT垂直搜索為特征的搜索引擎。”

二、使用正確的搜索詞
“使用搜索引擎要注意不能寫錯別字,此外要盡量使用大家比較常用的詞語。”
“這是為什么呢?”
“就目前而言,多數搜索引擎不支持容錯查詢。所以,一定要注意不寫錯別字。”

“容錯查詢,就是指即使用戶輸入了錯別字,搜索引擎也能根據某種規則推斷出該詞的正確寫法,給出正確的搜索結果。”

“由于互聯網的信息是人來提交的,如果你使用了不常用的詞語來搜索,就不大容易找到答案了。比如,你想查有關鼠標的信息,但輸入的是‘滑鼠’(港臺地區用語),就不容易找到資料了。”

三、正確使用布爾檢索
“正確的使用布爾檢索方式可以減少搜索結果的返回數。”
“什么是布爾檢索?我好像沒聽過”。

“布爾檢索,就是應用布爾表達式的檢索方式,比如‘和’(And)、‘或‘(OR)、‘非’(NOT)。其實前面介紹的搜索的數學規則就是這種布爾檢索。加號就相當于和,減號就相當于非。而或關系沒有介紹,它并不是很常用的檢索規則。在搜索時一方面要注意不同搜索引擎工具的布爾檢索的表達方法。另一方面,也要注意自己要搜索的內容邏輯關系是否合理。”

四、在點擊之前要思考
“成功的搜索=正確的提問+點擊有用的結果。”
“這么深奧?解釋一下吧。”
“就是說要想得到滿意的搜索結果除了要注意搜索條件之外,還取決于你最終點擊的那個搜索結果。”

“在返回的搜索結果中究竟哪個是真正滿意的?在點擊之前,你需要通過比較排序位置、網址鏈接、文字說明等來分析。關于這方面的知識我們在實戰演練時再學習。”

五、在實踐中取得搜索經驗
“搜索技巧和其他的技術一樣是在不斷練習中總結與成熟起來的。因此你必須不斷練習、不斷總結。”

“同時,通過練習總結,你可以形成自己的一套有效的搜索習慣。這將有助于更快的完成搜索。好像美美現在這樣,遇到一點困難就打了退堂鼓,可是不行的。”

“好了,基本的搜索技巧先講到這,關鍵還是多加練習。我們就以美美在搜索時遇到的那幾個問題試一下這些搜索技巧吧。”

“先讓我來試試。我好像已經找到一些原因了。”
“那就說說看吧。”
“司坦福大學,是錯別字。應該是斯坦福大學。”

“歌星王菲 精選專輯 –rm,是不是搜索條件太多?試一下,輸個簡單點的‘王菲 專輯 –rm’,找到了。”

“不僅是這個原因。你要搜索的關鍵字要符合習慣。這方面,新浪的幫助信息的有介紹。”

“世界杯預選賽 最新新聞。這個問題怎么解決呢?”

“用Google找到的結果確實是比較舊,因為目前Google的搜索數據庫的更新是每月一次(平均為28天),所以顯然用它來搜索新聞是不合適的。”

“而你在新浪遇到的是死鏈問題。死鏈對于搜索引擎而言是很正常的,這不是我幫搜索引擎開脫。實在是因為互聯網的信息更新的太快,它不容易抓取。除了死鏈問題,以后你還會遇到很多屬于搜索引擎的不足之處,比如它對于動態網頁處理能力不強之類的。”

“那有辦法找到這些死鏈的內容嗎?”

“辦法有一些。比如google就采用了網頁快照的技術。這個我們會在實戰演練中詳細介紹。”

“另一個辦法是:運用一些偵察技巧,加上你的好運氣,有可能會找到。”
“什么偵察技巧?”
“由于死鏈有時是因為網站制作者將文件更換路徑而搜索引擎沒有及時更新造成的。”

“據此,我們可以使用一種叫做‘URL退選’的方法。也就是將地址欄的網址的文件名一點點刪除,在碰到第一個斜杠后停止,然后敲回車鍵。重復此動作,不斷嘗試。運氣夠好的話,就能找到了。”

“聽起來很復雜啊。”

“要是你了解一些網站發布的知識會比較容易懂。雖然這種辦法并不總有效,但是還是值得嘗試的。”

“大連 天津街 地圖,這個是不是該用地圖搜索引擎?”
“對。比如Go2Map,ChinaQuest之類的地圖搜索引擎就能查到。”
“IT 新聞,為什么會查不到呢?”
“這個估計是因為StopWords造成的。”
“什么是StopWords?”

“這個涉及一些搜索技術方面的知識了。就拿英文而言,有大約300個最常用單詞本身缺乏實際意義或者使用過于廣泛,一旦用來搜索的話,會返回大量的無用的搜索結果甚至導致搜索引擎錯誤。因此很多搜索引擎都會屏蔽這些關鍵詞。”

“那在新浪怎么就能找到呢?”
“新浪能夠給出正確結果可能與它的搜索引擎服務提供商百度的技術有關。”
“太好了,我的問題幾乎都解決了。我還想學習更多的搜索知識呢?你們繼續教我啊。”

“可以啊,下一次我們會介紹幾個比較常用的搜索引擎。”


返回