文/陸元婕
小華,你會(huì)用搜索引擎嗎?
搜索引擎?就是那種一輸入條件,點(diǎn)擊開找,就能幫我找到資料的東東?這還用問,當(dāng)然會(huì)用了。這有何難?想找什么,說吧……
好,最近要畫流程圖,想知道用什么軟件畫,怎么畫。
嗯,用Google找,輸入,“畫流程圖的方法”。#¥%!¥%……奇怪,“找不到和您的查詢-畫流程圖的方法-相符的網(wǎng)頁”。再換新浪找,輸入“畫流程圖的方法”。有結(jié)果,可是點(diǎn)過去一看,sigh,只是一個(gè)課程表。……
……
是了,一定是網(wǎng)上根本就沒有這樣的資料。
真的嗎?我還是去問問小張吧,聽說他研究過搜索引擎的。
想找畫流程圖方面的資料?嗯,是不大好找。不過,我一般使用Visio繪制流程圖,Word也可以畫簡單的流程圖,我們來逐個(gè)試試看吧。輸入“Word
流程圖”,“visio 流程圖”,看,果然有些有用的資料。
謝謝你。你教我用搜索引擎吧。省得以后老麻煩別人幫我找資料?
真神奇,我也想學(xué)。小華說。
好,我就來介紹一些簡單實(shí)用的使用方法吧。
要學(xué)習(xí)搜索技巧,首先要了解一下什么是搜索引擎。正所謂知己知彼啊。
知己知彼——基礎(chǔ)知識(shí)篇
搜索引擎是一種用于幫助互聯(lián)網(wǎng)用戶查詢信息的搜索工具,它以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息,對信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。
聽起來,好像很復(fù)雜啊。
其實(shí),最簡單的說法,就是用來在網(wǎng)上找資料的工具。它的出現(xiàn)也蠻富有趣味的呢。
誕生歷史
十幾年前,萬維網(wǎng)還沒有出生的時(shí)候,網(wǎng)民在很短的時(shí)間內(nèi)就掌握其中的全部信息,搜索引擎完全沒有出現(xiàn)的必要。
1993年,互聯(lián)網(wǎng)上出現(xiàn)了最早的Web瀏覽器Mosaic,次年Netscape推出了Navigator。瀏覽器的發(fā)展促使Web得到迅速推廣,站點(diǎn)數(shù)目以驚人的速度增加。于是,搜索引擎就誕生了。
第一個(gè)搜索引擎的出生地在美國,它的名字叫Archie,是由McGill大學(xué)的一個(gè)小組開發(fā)的。
隨著互聯(lián)網(wǎng)的信息按幾何式增長,搜索引擎開始快速發(fā)展。
1994年春天,世界上出現(xiàn)了最早的真正意義上的搜索引擎——Lycos。
隨著Yahoo!的出現(xiàn),搜索引擎的發(fā)展也進(jìn)入了黃金時(shí)代,其性能也更加優(yōu)越。隨著搜索引擎家族的不斷發(fā)展壯大,逐漸分布到信息世界的各個(gè)角落,它們的種類、技術(shù)也在不斷的發(fā)生變化。
主要種類
目前有著數(shù)量眾多的搜索引擎,但按照它們信息搜集方法和服務(wù)提供方式的不同,可以大致劃分為三大主要類型:基于蜘蛛程序的的機(jī)器人搜索引擎、目錄式搜索引擎(Directory,也叫做Catalog)和Meta元搜索引擎。
機(jī)器人搜索引擎
這種搜索引擎由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序以某種策略的程序自動(dòng)訪問Web站點(diǎn),提取站點(diǎn)上的網(wǎng)頁,并根據(jù)網(wǎng)頁中的鏈接進(jìn)一步提取其它網(wǎng)頁,或轉(zhuǎn)移到其它站點(diǎn)上。由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。
聽起來感覺很復(fù)雜吧?簡單講,就是由程序自動(dòng)抓去網(wǎng)上的信息,“搜索引擎”這個(gè)詞的原義就是指這種狹義上的基于機(jī)器人的搜索引擎。
目錄式搜索引擎
這種搜索引擎是以人工方式或半自動(dòng)方式搜集信息,由編輯人員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。目錄的用戶界面基本上都是分級結(jié)構(gòu),首頁提供了最基本的幾個(gè)大類的入口,用戶可以一級一級地向下訪問,直至找到自己感興趣的類別,另外,用戶也可以利用目錄提供的搜索功能直接查找關(guān)鍵詞。
元搜索引擎
Meta搜索引擎也叫做Multiple Search Engine,它的特點(diǎn)是本身并沒有存放網(wǎng)頁信息的數(shù)據(jù)庫,當(dāng)用戶查詢一個(gè)關(guān)鍵詞時(shí),它把用戶的查詢請求轉(zhuǎn)換成其它搜索引擎能夠接受的命令格式,并行地訪問數(shù)個(gè)搜索引擎來查詢這個(gè)關(guān)鍵詞,并把這些搜索引擎返回的結(jié)果經(jīng)過處理后再返回給用戶。對于返回的結(jié)果系統(tǒng)會(huì)進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。
在了解了搜索引擎的基礎(chǔ)知識(shí)之后,我們再來學(xué)習(xí)一下搜索引擎搜索的基本規(guī)則。它們幾乎適用于目前大多數(shù)主流的搜索引擎,無論它是國內(nèi)的,還是國外的。就是說,它可是放至四海而皆準(zhǔn)的呦。
基本規(guī)則
使用具體查詢條件
你的查詢條件越具體,你就越容易找到你需要的文檔。
別怕向搜索引擎提交好象有點(diǎn)復(fù)雜的搜索條件。不然的話,它會(huì)返給你眾多搜索結(jié)果,你將又陷入一頁頁翻找的怪圈。
比如你想找一些有關(guān)“Excel數(shù)學(xué)函數(shù)的使用方法”的文章,你可搜索
“Excel數(shù)學(xué)函數(shù) ”,但不要僅查詢“Excel”。試比較在google中兩種查詢所返回的結(jié)果。第一種搜索條件返回了64項(xiàng)搜索結(jié)果,而第二種搜索條件返回了3,100,000項(xiàng)搜索結(jié)果。差別是不是很懸殊呢。所以,為了搜索結(jié)果的準(zhǔn)確一定要讓查詢條件具體一些。
使用基本數(shù)學(xué)規(guī)則
基本的數(shù)學(xué)規(guī)則包括加法、減法和乘法。
加法
有時(shí)你需要確認(rèn)搜索結(jié)果中包含所在你查詢的詞,而不是一部分。這時(shí)你可以使用搜索引擎的加法規(guī)則。即使用加號+或是空格。
減法
當(dāng)你需要在查詢某個(gè)題材時(shí)又不希望在這個(gè)題材中包含另一個(gè)題材,這時(shí)你就可以使用減法了,減法使用減號-。
什么什么嘛?這么復(fù)雜,講簡單一點(diǎn)啊。
別急,舉個(gè)例子就明白了。比如你想查詢有關(guān)“劉德華的歌曲享用你的姓”,但又不希望得到的結(jié)果是RM格式(Realplayer)的。你就可以輸入“劉德華
歌曲 享用你的姓 –RM”要記住一定要在減號前留一個(gè)空格位。就可以了。
減號的作用就在于可以使搜索結(jié)果集中反映你的需求,而你無需為大量無關(guān)的搜索結(jié)果而頭疼。
乘法
你已經(jīng)學(xué)會(huì)加法與減法,現(xiàn)在可以學(xué)乘法了,在搜索引擎中,乘法的公式是:“短語”。使用這一公式可以保證你的搜索結(jié)果將非常準(zhǔn)確。因?yàn)椋词故怯蟹衷~功能的搜索引擎也不會(huì)對引號內(nèi)的內(nèi)容進(jìn)行拆分。在很多搜索引擎中,給這種查詢方式起名叫短語查詢,或者專用詞語查詢。這一方法在查找名言警句或?qū)S忻~時(shí)顯得格外有用。
什么分詞?
分詞簡言之,就是把詞語進(jìn)一步劃分。比如,將一個(gè)長的詞組甚至句子分成多個(gè)詞語。分詞技術(shù)主要是用在像中文、日文這樣的亞洲語言。因?yàn)檫@些語言字與字之間,詞與詞之間是沒有空格的,它在搜索引擎的應(yīng)用恐怕是最近幾年的事情了。
關(guān)于基本的搜索規(guī)則已經(jīng)講完了。在有些搜索引擎中還會(huì)支持什么通配符之類的,因?yàn)椴⒉黄毡椋筒欢嗾f了。有些集成式的搜索引擎,也叫綜合搜索引擎,比如新浪。允許用戶在目錄中進(jìn)行關(guān)鍵詞的搜索。所以,還有一種縮小搜索范圍的辦法就是先選擇能夠確定的目錄,然后再用這些規(guī)則進(jìn)行搜索。其實(shí)這就是應(yīng)用搜索的減法規(guī)則。
學(xué)完了基本的搜索規(guī)則,你們想不想知道一些搜索的使用技巧呢?
別賣關(guān)子了,這還用問?誰不想搜索的更快更準(zhǔn)啊?快說說吧。
省時(shí)高效——實(shí)用技巧篇
選擇合適的搜索工具
工欲善其事,必先利其器。每種搜索引擎都有不同的特點(diǎn),只有選擇合適的搜索工具才能得到最佳的結(jié)果。前面我們已經(jīng)了解了搜索工具基本上可以分為網(wǎng)頁檢索(也就是上次說的基于蜘蛛程序的機(jī)器人檢索系統(tǒng))和分類目錄(即目錄式搜索引擎)兩種(我們先不談元搜索引擎)。這里先介紹一下這兩種工具的區(qū)別。
網(wǎng)頁檢索實(shí)際上是網(wǎng)頁的完全索引。分類目錄則是由人工編輯整理的網(wǎng)站的鏈接。這兩種搜索工具究竟哪種更好用?這取決于你想查詢的問題。
因?yàn)樗阉饕娴奶攸c(diǎn)是量大,分類目錄的特點(diǎn)是網(wǎng)站是經(jīng)過挑選的。一般而言,如果你需要查找非常具體或者特殊的問題,用網(wǎng)頁檢索比較合適;如果你希望瀏覽某方面的信息、專題或者查找某個(gè)具體的網(wǎng)站,分類目錄可能會(huì)更合適。
此外,如果你需要查找的是某些確定的信息,比如Mp3、地圖等,就最好使用專門的Mp3、地圖等搜索引擎。
咦,原來還有這樣的搜索引擎?
當(dāng)然了。實(shí)際上幾乎每一類信息都有非常專業(yè)的搜索工具,我們稱為垂直搜索引擎。比如賽迪網(wǎng)的IT羅盤就是以精選式IT垂直搜索為特征的搜索引擎。圖形天下Go2map就是專門提供地圖搜索服務(wù)的地圖搜索引擎。
避免使用錯(cuò)誤的搜索條件
在搜索時(shí),要避免下面的搜索錯(cuò)誤,這樣才能返回更為有用的搜索結(jié)果。
Stop words
很多搜索引擎都會(huì)屏蔽一些關(guān)鍵詞。當(dāng)你在搜索框中輸入這些詞是,不會(huì)返回正確的搜索結(jié)果。這些詞就被稱作“Stop
words”。
為什么搜索引擎會(huì)屏蔽這些詞?
這是因?yàn)檫@些詞本身是缺乏實(shí)際意義的或者使用過于廣泛,大都是副詞、連詞之類的,一旦用來搜索的話,會(huì)返回大量的無用的搜索結(jié)果甚至導(dǎo)致搜索引擎錯(cuò)誤。
哪些詞屬于“Stop words”呢?
英語中的300個(gè)最常用單詞中的絕大部分都屬于這類詞。
過于通俗簡單的詞語
大多數(shù)搜索引擎在處理太簡單通俗的詞語方面有問題。這不是因?yàn)樗阉饕媲甯呋蚴亲源螅侨Q于它的搜索機(jī)制——基于關(guān)鍵詞檢索。由于網(wǎng)上相關(guān)信息的數(shù)量是巨大的,如果使用過于通俗簡單的詞語,就會(huì)返回過多的搜索結(jié)果,因而就很難查到有用的信息。
錯(cuò)別字
目前而言,大多數(shù)搜索引擎還不能夠進(jìn)行容錯(cuò)查詢。所以,一定要注意關(guān)鍵詞的正確寫法。
什么是容錯(cuò)查詢?
所謂容錯(cuò)查詢,就是指即使用戶輸入了錯(cuò)別字,搜索引擎也能根據(jù)某種規(guī)則推斷出該詞的正確寫法,給出正確的搜索結(jié)果。
正確使用布爾檢索
正確的使用布爾檢索方式可以減少搜索結(jié)果的返回?cái)?shù)。
什么是布爾檢索?我好像沒聽說過啊。
布爾檢索,就是應(yīng)用布爾表達(dá)式的檢索方式,比如“和”(And)、“或”(OR)、“非”(NOT)。其實(shí)前面介紹的搜索的數(shù)學(xué)規(guī)則就是這種布爾檢索。加號就相當(dāng)于和,減號就相當(dāng)于非。而或關(guān)系沒有介紹,它并不是很常用的檢索規(guī)則。
由于不同的搜索引擎在布爾檢索的具體表達(dá)式寫法上有區(qū)別,使得很多人在使用布爾檢索方式時(shí),出現(xiàn)了一些錯(cuò)誤,這樣就會(huì)影響到返回的搜索結(jié)果。因此在搜索時(shí)一方面要注意不同搜索引擎工具的布爾檢索的表達(dá)方法。
在點(diǎn)擊之前要思考
成功的搜索等式=正確的提問產(chǎn)生準(zhǔn)確有用的結(jié)果。
在返回的搜索結(jié)果中究竟哪個(gè)是真正滿意的?在點(diǎn)擊之前,你仍然需要思考決定。你需要通過比較排序位置、網(wǎng)址鏈接、文字說明等來分析。這就需要對各種搜索引擎的排序方式做一簡單的了解。
養(yǎng)成良好有效的搜索習(xí)慣
搜索技巧和其他的技術(shù)一樣是在不斷練習(xí)中總結(jié)與成熟起來的。因此必須不斷練習(xí)、不斷總結(jié)。通過練習(xí)總結(jié),你可以形成自己的一套有效的搜索習(xí)慣。這將有助于更快的完成搜索。不是有句話說,師傅領(lǐng)進(jìn)門,修行在各人嗎。好了,關(guān)于搜索的實(shí)用知識(shí)就先介紹到這吧,要多多練習(xí)啊。等你們對搜索真的產(chǎn)生興趣的時(shí)候,我們可以一起研究更好的搜索方法了。
|