搜網(wǎng)全能搜,幫您一鍵實現(xiàn)對百度、google谷歌、360搜索、搜狗、搜搜等搜索引擎及影視娛樂、圖片、音樂歌曲、問題知識、論壇、微信、微博、淘寶網(wǎng)上購物等熱門網(wǎng)站搜索,方便快速找到您需要的東西!

 

 

·收藏本站
·網(wǎng)站推廣
·搜索論壇

   首 頁 - 搜網(wǎng)全能搜 - 搜索引擎大全 - 搜索入門到精通 - 搜索引擎登錄 - 搜索愛好者
    

利用Google進行專題信息檢索的方法和技巧

  http://www.803ums.cn   2004年6月10日  來源: 搜索論壇


    摘要 隨著科學研究所依賴的各種信息資源的大規(guī)模網(wǎng)絡化數(shù)字化,搜索引擎逐漸成為網(wǎng)絡時代的最快捷方便的個性化信息服務系統(tǒng)。Google成為目前最受歡迎的搜索引擎 ,本文全面詳細總結了利用Google進行專題信息檢索的方法和技巧。

 

關鍵詞 個性化 信息服務 信息檢索 專題檢索 搜索 Google 方法 技巧

    目前,科學研究依賴的各種信息資源,包括文摘索引、期刊論文、預印本、技術報告、學位論文、會議論文、以及部分重要工具書和專著等在內的主流科研信息資源已經(jīng)逐步數(shù)字化,開始形成一個逐步完善的數(shù)字化信息資源空間,科研人員可以通過網(wǎng)絡跨時空的進行專題信息檢索,獲取相關科研文獻資源[1]。
基于網(wǎng)頁內容的全文檢索技術是搜索引擎的核心,搜索引擎也是全自動的軟件服務。從目前來看,搜索引擎,尤其是Google已成為網(wǎng)絡時代最快捷方便的個性化信息服務系統(tǒng)和服務方式。[2]

1 Google成為目前最受歡迎的搜索引擎
Google(WWW.Google.com)是當今一個優(yōu)秀的搜索引擎,其功能強大、特點突出、技術先進和服務優(yōu)良,它在業(yè)界評測中獲得多項大獎,各大引擎競相模仿其功能和特色。Google非中國本土公司,但它支持中文搜索,其中文搜索引擎是收集亞洲網(wǎng)站最多的搜索引擎之一,國內使用其獨立搜索引擎的人數(shù)急劇增長。
目前,全世界訪問量最大的4個網(wǎng)站中,3家采用了Google的搜索技術,80%的互聯(lián)網(wǎng)搜索是通過Google或使用Google技術的網(wǎng)站完成的。目前Google每個月接待來自世界各地的超過2800萬獨立訪問者,全球網(wǎng)民通過Google可以使用86種語言,搜索30多億個網(wǎng)頁及其網(wǎng)頁快照,以及4億多張圖片,每個月Google被用戶使用的時間為1500萬小時左右。
據(jù)搜索引擎觀察者網(wǎng)絡雜志統(tǒng)計結果顯示,至2002年10月份,網(wǎng)民使用Google的時間量每月達到1610萬小時;相比之下,雅虎只吸引了660萬小時,微軟 MSN僅有520萬小時[3]。

2 利用Google進行專題信息檢索的方法和技巧
關鍵詞檢索功能是網(wǎng)絡信息檢索工具的基本檢索功能,也是Google最基本的檢索功能。關鍵詞屬于自然語言,靈活、不受詞表控制,但簡單的關鍵詞檢索方法,命中過多,查準率很低,Google為改善關鍵詞檢索性能,提供了按相關度排列結果、布爾邏輯檢索,短語或者句子檢索、加權檢索和限制檢索等增強措施。
利用Google進行專題信息檢索,為提高查準率,須認真分析課題,選擇恰當?shù)年P鍵詞,掌握和運用Google檢索語法規(guī)則,準確設計表達需求的檢索式,反復調整檢索策略,才能獲得高質量的檢索結果。

2.1 簡單專題信息檢索,最直截了當就是在搜索框內輸入一個關鍵詞,然后點擊下面的“Google搜索”按鈕(或者直接回車),結果就出來了。
如果檢索人員或用戶對查詢的領域熟悉,只想尋找某些專題網(wǎng)站,首先考慮用目錄檢索,Google根據(jù)其專業(yè)的“網(wǎng)頁級別”(PageRank)技術對目錄中登錄的網(wǎng)站進行了排序,可以使檢索具更高效率,按所需主題確定沿某類層層查找網(wǎng)站,目錄分類明確,網(wǎng)站專題信息集中,剔除了大量不相關的信息,不過對查找中文信息,Google的中文目錄太少,只有非常普通簡單的類目,可能很難滿足要求。

2.2 熟練掌握Google的基本搜索:+,-,OR ,學會使用兩個關鍵字進行復雜專題信息檢索
檢索復雜專題依靠單個關鍵詞查準率很低,要提高查全檢準率,需進行詳細的主題分析,選擇多個關鍵詞構造檢索式。要分清主要概念和次要概念,去掉被隱含了的概念,確定需要排除的某些概念和不宜選用的泛指概念,以便在制定檢索策略時有所側重,保證檢索提問的確切表達。
正確選擇關鍵詞,各種類型的檢索課題對檢索的查全率和查準率有著不同的要求,可以增加上位概念或下位概念的方法來擴檢[4],若查準率要求較高,應使用專指性較強的概念或增加限制概念來縮小檢索范圍,還可通過對字段進行限定的方式來保證查找的準確性。對于那些對查全率和查準率無特殊要求的用戶來說,也要針對不同的課題,制定相應的檢索策略。
對文獻量較大或屬于成熟學科的課題,應優(yōu)先考慮查準率,從眾多的相關文獻中選取針對性較強的文獻。對文獻較少或新興學科的課題,可適當放寬檢索范圍來保證查全率,以免遺漏重要的參考文獻。
選擇正確的關鍵詞后,就要運用Google檢索語法規(guī)則構建檢索式。

Google無需用明文的“+”來表示邏輯“與”操作,只要空格就可以了。
示例:搜索所有包含關鍵詞“易筋經(jīng)”和“吸星大法”的中文網(wǎng)頁
搜索式:“易筋經(jīng) 吸星大法”(注意:文章中搜索語法外面的引號僅起引用作用,不能帶入搜索欄內。)

Google用減號“-”表示邏輯“非”操作。 
示例:搜索所有包含“易筋經(jīng)”而不含“吸星大法”的中文網(wǎng)頁
搜索式:“易筋經(jīng) -吸星大法”(注意:這里的“+”和“-”號,是英文字符,而不是中文字符的“+”和“-”。此外,操作符與作用的關鍵字之間,不能有空格。比如“易筋經(jīng) - 吸星大法”,搜索引擎將視為邏輯“與”操作,中間的“-”被忽略。)

Google用大寫的“OR”表示邏輯“或”操作( 注意:小寫的“or”,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次“與”查詢)。但是,關鍵字為中文的或查詢似乎還有BUG,無法得到正確的查詢結果。
示例:搜索包含布蘭妮“Britney”或者披頭士“Beatles”、或者兩者均有的中文網(wǎng)頁。
搜索式:“britney OR beatles”
結果:已搜索有關britney OR beatles的中文(簡體)網(wǎng)頁。共約有14,600項查詢結果,這是第1-10項。搜索用時0.08秒。
搜索式:“布蘭妮 OR 披頭士”
結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網(wǎng)頁。

“+”和“-”的作用有的時候是相同的,都是為了縮小搜索結果的范圍,提高查詢結果命中率。
例:查閱天龍八部具體是哪八部。 
分析:如果光用“天龍八部”做關鍵字,搜索結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的信息。可以用兩個方法減少無關結果。 
( 1)、如果你知道八部中的某一部,比如阿修羅,增加“阿修羅”關鍵字,如“天龍八部 阿修羅”。搜索結果就只有995項,可以直接找到全部八部。 
( 2)、如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,如“天龍八部 佛教 -金庸”。查詢結果為1,010項,可以迅速找到需要的資料。

2.3 熟悉Google的輔助搜索方法:通配符、大小寫、句子、忽略字符以及強制搜索 [5]
Google不支持通配符,如“*”、“?”等,只能做精確查詢,關鍵字后面的“*”或者“?”會被忽略掉。 
Google對英文字符大小寫不敏感,“GOD”和“god”搜索的結果是一樣的。  
Google的關鍵字可以是詞組(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。
示例:搜索包含“l(fā)ong, long ago”字串的頁面。
搜索式:““l(fā)ong, long ago“”
結果:已向英特網(wǎng)搜索“l(fā)ong, long ago“. 共約有28,300項查詢結果,這是第1-10項。搜索用時0.28秒。 
注意:和搜索英文關鍵字串不同的是,Google對中文字串的處理并不十分完善。比如,搜索““啊,我的太陽“”,我們希望結果中含有這個句子,事實并非如此。查詢的很多結果,“啊”、“我的”、“太陽”等詞語是完全分開的,但又不是“啊 我的 太陽”這樣的與查詢。

Google對一些網(wǎng)絡上出現(xiàn)頻率極高的詞(主要是英文單詞),如“i”、“com”,以及一些符號如“*”、“.”等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法“+”。
示例:搜索包含“Who am I ?”的網(wǎng)頁。如果用““who am i ?“”,“Who”、“I”、“?”會被省略掉,搜索將只用“am”作關鍵字,所以應該用強制搜索。
搜索式:““+who +am +i“”(注意:英文符號(如問號,句號,逗號等)無法成為搜索關鍵字,加強制也不行 )
結果:已向英特網(wǎng)搜索“+who +am +i“. 共約有362,000項查詢結果,這是第1-10項。搜索用時0.30秒。

2.4 了解Google的高級搜索語法:site,link,inurl,allinurl,intitle,allintitle

“site”表示搜索結果局限于某個具體網(wǎng)站或者網(wǎng)站頻道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某個域名,如“com.cn”、“com”等等。如果是要排除某網(wǎng)站或者域名范圍內的頁面,只需用“-網(wǎng)站/域名”。 
示例:搜索中文教育科研網(wǎng)站(edu.cn)上所有包含“金庸”的頁面。
搜索式:“金庸 site:edu.cn”
示例:搜索包含“金庸”和“古龍”的中文新浪網(wǎng)站頁面,
搜索式:“金庸 古龍 site:sina.com.cn”
結果:已在sina.com.cn搜索有關金庸 古龍的中文(簡體)網(wǎng)頁。共約有869項查詢結果,這是第1-10項。搜索用時0.34秒。
注意:site后的冒號為英文字符,而且,冒號后不能有空格,否則,“site:”將被作為一個搜索的關鍵字。此外,網(wǎng)站域名不能有“http”以及“www”前綴,也不能有任何“/”的目錄后綴;網(wǎng)站頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。諸如“金庸 site:edu.sina.com.cn/1/”的語法是錯誤的。

  
使用“l(fā)ink”語法,將搜索到所有鏈接到某個URL地址的網(wǎng)頁。 
示例:搜索所有含指向華軍軟件園“www.newhua.com”鏈接的網(wǎng)頁。
搜索式:“l(fā)ink:www.newhua.com”  
注意:“l(fā)ink”不能與其他語法相混合操作,所以“l(fā)ink:”后面即使有空格,也將被Google忽略。

使用inurl語法,返回的網(wǎng)頁鏈接中包含第一個關鍵字,后面的關鍵字則出現(xiàn)在鏈接中或者網(wǎng)頁文檔中。有很多網(wǎng)站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網(wǎng)頁名稱中,比如“MP3”、“GALLARY”等,于是,就可以用INURL語法找到這些相關資源鏈接,然后,用第二個關鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。
示例:查找MIDI曲“滄海一聲笑”。
搜索式:“inurl:midi 滄海一聲笑”
結果:已搜索有關inurl:midi 滄海一聲笑的中文(簡體)網(wǎng)頁。共約有14項查詢結果,這是第1-10項。搜索用時0.01秒。
示例:查找微軟網(wǎng)站上關于windows2000的安全課題資料。
搜索式:“inurl:security windows2000 site:microsoft.com”
結果:已在microsoft.com內搜索有關 inurl:security windows2000的網(wǎng)頁。共約有198項查詢結果,這是第1-10項。搜索用時0.37秒。
注意:“inurl:”后面不能有空格,Google也不對URL符號如“/”進行搜索。Google對“cgi-bin/phf”中的“/”當成空格處理。

使用allinurl語法,返回的網(wǎng)頁鏈接中包含所有查詢關鍵字,這個查詢的對象只集中于網(wǎng)頁的鏈接字符串。   
示例:查找可能具有PHF安全漏洞的公司網(wǎng)站。通常這些網(wǎng)站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現(xiàn)在鏈接中就是“域名/cgi-bin/phf”。
搜索式:“allinurl:“cgi-bin“ phf +com”
結果:已向英特網(wǎng)搜索allinurl:“cgi-bin“ phf +com. 共約有40項查詢結果,這是第1-10項。搜索用時0.06秒。 
allintitle和intitle的用法類似于上面的allinurl和inurl,只是后者對URL進行查詢,而前者對網(wǎng)頁的標題欄進行查詢。網(wǎng)頁標題,就是HTML標記語言title中之間的部分。網(wǎng)頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網(wǎng)頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。
示例:查找日本明星藤原紀香的照片集。
搜索式:“intitle:藤原紀香 寫真”
結果:已搜索有關intitle:藤原紀香 寫真的中文(簡體)網(wǎng)頁。共約有284項查詢結果,這是第1-10項。搜索用時0.03秒。

2.5 Google的罕用高級搜索語法:related,cache,info

related用來搜索結構內容方面相似的網(wǎng)頁。例:搜索所有與中文新浪網(wǎng)主頁相似的頁面(如網(wǎng)易首頁,搜狐首頁,中華網(wǎng)首頁等),“related:www.sina.com.cn/index.shtml”。 
cache用來搜索Google服務器上某頁面的緩存,這個功能同“網(wǎng)頁快照”,通常用于查找某些已經(jīng)被刪除的死鏈接網(wǎng)頁,相當于使用普通搜索結果頁面中的“網(wǎng)頁快照”功能。
info用來顯示與某鏈接相關的一系列搜索,提供cache、link、related和完全包含該鏈接的網(wǎng)頁的功能。
示例:查找和新浪首頁相關的一些資訊。
搜索式:“info:www.sina.com.cn”

3 Google的其他重要功能介紹
 
目錄服務  如果不想搜索網(wǎng)頁,而是想尋找某些專題網(wǎng)站,可以訪問Google的分類目http://directory.Google.com/”,中文目錄http://directory.Google.com/Top/World/Chinese_Simplified/”。不過由于Google的目錄由志愿者服務,而GOOGLE在國內名氣相對比較小,因此中文目錄下收錄站點很少[6]。
 
工具條  為了方便搜索者,Google提供了工具條,集成于瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具條內輸入關鍵字進行搜索。此外,工具條還提供了其他許多功能,如顯示頁面PageRank、設置攔截彈出廣告等。最方便的一點在于用戶可以快捷的在Google主頁、目錄服務、新聞組搜索、高級搜索和搜索設定之間切換。目前Google主頁已提示下載安裝Google工具條。

新聞組(USENET)搜索 新聞組中有大量的有價值信息,DEJA一直是新聞組搜索引擎中的佼佼者。2001年2月份,Google將DEJA收購并提供了所有DEJA的功能。現(xiàn)在,除了搜索之外,Google還支持新聞組的WEB方式瀏覽和張貼功能。輸http://groups.Google.com/”后,便進入Google新聞組界面。可惜現(xiàn)在還沒有中文界面。新聞組高級搜索界面提供對關鍵字、新聞組、主題、作者、帖子序號、語言和發(fā)布日期的條件搜索。其中作者項指作者發(fā)帖所用的唯一識別號電子信箱。比如要在alt.chinese.text內搜索著名老牌網(wǎng)絡寫手圖雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不過一般而言,更推薦使用圖形搜索界面,方便而且直觀。

搜索結果翻譯   曾經(jīng)為那些你不懂的法文、西班牙文頁面煩惱么?現(xiàn)在,Google支持一項搜索結果翻譯功能,可以把非英文的搜索結果翻譯成英文!!目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文。只能在英文狀態(tài)Google下實現(xiàn)這個功能。進入Google的設置頁http://www.Google.com/preferences,有一個“BETA: Enable translation of search results into your interface language. ”的選項,把它選中,就OK了。

  
搜索結果過濾 網(wǎng)絡上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,Google新設立了成人內容過濾功能,見Google的設置頁http://www.Google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態(tài)下的Google尚沒有這個功能。 

PDF文檔搜索   Google提供對PDF文檔內文的檢索。目前Google檢索的PDF文檔大約有2500萬左右。PDF是ADOBE公司開發(fā)的電子文檔格式,現(xiàn)在已經(jīng)成為互聯(lián)網(wǎng)的電子化出版標準。PDF文檔通常是一些圖文并茂的綜合性文檔,提供的資訊一般比較集中全面。 
示例:搜索關于電子商務(ECOMMERCE)的PDF文檔。
搜索式:“inurldf ecommerce”   
下面是某項搜索結果:  
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf  Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product  Marketing Professonial (PMP) Implementation Manager, Web Engineering ...   一般文字檔 - 類似網(wǎng)頁
可以看到,Google在PDF檔前加上了[PDF]的標記,而且,Google把PDF文件轉換成了文字檔,點擊“一般文字檔”,可以粗略的查看該PDF文檔的大致內容。當然,PDF原有的圖片以及格式是沒有了。
 
圖像文檔搜索   Google提供了Internet上圖像文件的搜索功能!!地址是“images.Google.com”。你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如“劉德華”。 Google給出的搜索結果具有一個直觀的縮略圖,以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。屏幕右上角有一個“移除欄框”的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。Google還提供了對成人內容圖像的限制功能,可以讓搜索者免受不必要的騷擾。

4 Google特殊應用搜索實例介紹: 
關鍵詞的選擇在搜索中起到?jīng)Q定性的作用,所有搜索技巧中,關鍵詞選擇是最基本也是最有效的。

4.1 搜索之前先思考   搜索引擎本事再大,也搜索不到網(wǎng)上沒有的內容,而且,有些內容雖然存在網(wǎng)上,卻因為各種原因,而成為漏網(wǎng)之魚。所以在你使用搜索引擎搜索之前,應該先花幾秒種想一下,我要找的東西網(wǎng)上可能有嗎?網(wǎng)頁上會含有哪些關鍵字? 

例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。
分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜索引擎先找到這本書,然后再翻到該段落。這樣做當然可以,但是效率很低。如果了解目標信息的構成,用一些目標信息所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜索,關鍵字不一定就是目標信息的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關系時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。 
搜索:“酒貴賤之”,OK,找到的第一條信息就是鏡花緣的這一段落:“先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...” 以上的關鍵字選擇技巧可以謂之“特定詞法”。

例二:“黃花閨女”一詞中“黃花”是什么意思。 
分析:“黃花閨女”是一個約定的俗語,如果只用“黃花閨女 黃花”做關鍵詞,搜索結果將浩如煙海,沒什么價值,因此必須要加更多的關鍵詞,約束搜索結果。選擇什么關鍵詞好呢?備選的有“意思”、“含義”、“來歷”、“由來”、“典故”、“出典”、“淵源”等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字里,所以用諸如“來歷”、“由來”、“出典”等詞匯的概率更高一些。
搜索式:“黃花閨女 黃花 由來”,查到“黃花”原來出典于《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用“太平御覽 壽陽公主”做搜索了。 以上的關鍵字選擇技巧可以謂之“近義詞法”。

例三:劉德華的胸圍是多少。 
分析:非常直接的搜索是,“劉德華 胸圍”,但事實上,這么搜索出來的結果,盡是一些諸如“劉德華取笑莫文蔚胸圍太小”之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關信息。OK,這樣就可以進一步的增加其他約束性關鍵詞以縮小搜索范圍。 
搜索式:“劉德華 胸圍 身高”,沒有料到的情況發(fā)生了,網(wǎng)上炙手可熱的痞子蔡《第一次親密接觸》里居然含有這樣關鍵字,阿泰“改編自劉德華《忘情水》的變態(tài)歪歌”、“用身高體重三圍和生日來加以編號”。好辦,把這部小說去掉,“劉德華 胸圍 身高 -阿泰”,OK,結果出來了,華仔胸圍84cm。說明一下,為什么用“阿泰”而不用“第一次親密接觸”呢?這是因為小說的名字被轉載的時候可能有變動,但里面角色的名字是不會變的。 
以上的關鍵字選擇技巧可以謂之“相關詞法”。

4.2 其他常用搜索個案
 
例一:找人   分析:一個人在網(wǎng)上揭示的資料通常有:姓名,網(wǎng)名,性別,年齡,畢業(yè)學校,工作單位,外號,住址,電話,信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要了解一下你多年沒見過的同學,那不妨用上述信息做關鍵字進行查詢,也許會有大的收獲。

例二:找軟件 分析一:最簡單的搜索當然就是直接以軟件名稱以及版本號為關鍵字查詢。但是,僅僅有軟件名稱和目標網(wǎng)站,顯然還不行,因為搜索到的可能是軟件的相關新聞。應該再增加一個關鍵字。考慮到下載頁面上常有“點擊此處下載”或者“download”的提示語,因此,可以增加“下載”或者“download”為關鍵字。
如, 搜索式:“winzip 8.0 下載”
分析二:很多網(wǎng)站設有專門的下載目錄,而且就命名為“download”,因此,可以用INURL語法直接搜索這些下載目錄。
搜索式:“winzip 8.0 inurl:download”
在互聯(lián)網(wǎng)上隨意的下載軟件是不安全的,因為供下載的軟件有可能帶有病毒或者捆綁了木馬,所以,對下載網(wǎng)站作一個限定,是一個穩(wěn)妥的思路。可以用SITE語法達到這個目的。 
共享軟件下載完之后,使用的時候,軟件總跳出警示框,或者軟件的功能受到一定限制。由于中國的網(wǎng)民多是人,所以應該再找一個注冊碼。找注冊碼,除了軟件的名稱和版本號外,還需要有諸如“serial number”、“sn”、“序列號”等關鍵字。現(xiàn)在,來搜索一下winzip8.0的注冊碼。
搜索式:“winzip 8.0 sn”
結果:已向英特網(wǎng)搜索winzip 8.0 sn. 共約有777項查詢結果,這是第1-10項。搜索用時0.30秒。
 
例三:找圖片 除了Google提供的專門圖片搜索功能,還可以組合使用一些搜索語法,達到圖片搜索之目的。
分析一:專門的圖片集合,提供圖片的網(wǎng)站通常會把圖片放在某個專門目錄下,如“gallary”、“album”、“photo”、“image”等。這樣就可以使用INURL語法迅速找到這類目錄。現(xiàn)在,試著找找小甜甜布蘭妮的照片集。
搜索式:““britney spears“ inurlhoto”
結果:已向英特網(wǎng)搜索“britney spears“ inurlhoto. 共約有2,720項查詢結果,這是第1-10項。搜索用時0.23秒。
分析二:提供圖片集合的網(wǎng)頁,在標題欄內通常會注明,這是誰誰的圖片集合。于是就可以用INTITLE語法找到這類網(wǎng)頁。
搜索式:“intitle:“britney spears“ picture”
結果:已向英特網(wǎng)搜索intitle:“britney spears“ picture. 共約有317項查詢結果,這是第1-10項。搜索用時0.40秒。
分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。于是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。
搜索式:““britney spears“ site:geocities.com”
結果:已在geocities.com內搜索有關“britney spears“的網(wǎng)頁。共約有5,020項查詢結果,這是第1-10項。搜索用時0.47秒。

例四:找MP3  分析一:提供MP3的網(wǎng)站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。所以,可以用INURL語法迅速找到這類目錄。現(xiàn)在用這個辦法找找老歌“say you say me”。
搜索:““say you say me“ inurl:mp3”
結果:已向英特網(wǎng)搜索inurl:mp3 “say you say me“. 共約有155項查詢結果,這是第1-10項。搜索用時0.17秒。
分析二:也可以通過網(wǎng)頁標題,找到這類提供MP3的網(wǎng)頁。
搜索式:““say you say me“ intitle:mp3”
結果:已向英特網(wǎng)搜索“say you say me“ intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜索用時0.73秒。
當然,如果你知道某個網(wǎng)站的下載速度快,而且樂曲全,就可以用SITE語法先到該網(wǎng)站上看看有沒有目標樂曲。

例五:找書  分析一:常訪問的電子圖書館類網(wǎng)站就那么幾個,比如文藝類的“www.shuku.net”。于是可以用SITE語法很簡單的找到某本書(如果該網(wǎng)站上有的話)。比如,“舊唐書 site:shuku.net”,就可以馬上找到該書。如果沒有,通常別的網(wǎng)站上也很難找到。因此,找書的關鍵,是你了解一大批著名的圖書館網(wǎng)站。 
分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對于迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經(jīng)讀過該書,對書的內容有印象的基礎上。比如如果了解堂吉訶德一書戰(zhàn)風車的大致內容,就可以用“吉訶德 風車 桑喬”迅速找到該書。

5 掌握搜索結果價值高低的簡單評測方法

  一次成功的搜索由兩個部分組成:正確的搜索關鍵詞,有用的搜索結果。在你點擊任何一條搜索結果之前,快速地分析一下你的搜索結果的標題、網(wǎng)址、摘要,會有助于你選出更準確的結果,幫你節(jié)省大量的時間。當然,到底哪一個是你需要的內容,取決于你在尋找什么,評估網(wǎng)絡內容的質量和權威性是搜索的重要步驟。
一次成功的搜索也經(jīng)常是由好幾次搜索組成的,如果對自己搜索的內容不熟,即使是搜索專家,也不能保證第一次搜索就能找到想要的內容。搜索專家會先用簡單的關鍵字測試,他不會忙著仔細查看各條搜索結果,而是先從搜索結果頁面里尋找更多的信息,再設計一個更好的關鍵字重新搜索,這樣重復多次以后,就能設計出很棒的搜索關鍵詞,也就能搜索到滿意的搜索結果了[7]。
由于因特網(wǎng)信息資源還存在良莠不齊、信息垃圾充斥的現(xiàn)象,許多學者對因特網(wǎng)信息資源的準確性、可靠性還存有一定的懷疑,基于這一方面的原因,對于搜索引擎檢索結果價值的高低進行簡單測評也是我們應該掌握的檢索技能之一,對具體檢索結果價值高低及權威性的測評方法有如下幾點:

5.1 根據(jù)檢索結果輸出的排序測評
搜索引擎的檢索結果集通常是很龐大的,大量的網(wǎng)頁使得檢索者無法逐一瀏覽,搜索引擎可以按網(wǎng)頁與檢索提問的相關程序進行排序,最相關的網(wǎng)頁通常排在最前面。目前依據(jù)網(wǎng)站被鏈接數(shù)量的多少,同時參考網(wǎng)站被點擊次數(shù)的多少來進行排序的方法,是目前最通用的做法。

5.2 根據(jù)檢索結果發(fā)布者的權威性測評
所謂檢索結果發(fā)布者的權威性是指信息的發(fā)布者應在相應的專業(yè)領域具有一定的權威性。一般地說,某個專業(yè)較著名的權威機構或專家所擁有的網(wǎng)站和發(fā)布的信息是真實可靠的,具有較高的質量。尤其是大學和研究機構的網(wǎng)站,一般在發(fā)布前已對信息作過審查和篩選,這樣的信息權威性強。同時通過對網(wǎng)站被其他網(wǎng)站鏈接,被專業(yè)論文引用的情況也可以對該網(wǎng)站的權威性進行分析[8]。因此,檢索結果發(fā)布者的權威性也是我們測評檢索結果的重要因素之一。

5.2.1 我們可以從頁面上部或底部尋找作者姓名、組織機構名稱或公司名稱[9]
如果是個人頁面,那么是否有作者簡介,看看他的受教育程度、職位、所屬單位等,如果是一個組織機構或公司,是否有詳細的介紹頁面,其歷史怎樣?發(fā)布這些信息的目的如何?這些個人或單位你是否聽過?是否是你熟悉的?信譽是否良好?這些都有助于你判讀出其頁面內容的可信程度。
比如ChinaByte,從它的主頁上很容易找到“關于本站”選項,里面有ChinaByte的歷史,下設頻道、相關編輯及聯(lián)系方式。如果你對哪個頻道有疑問,可以直接發(fā)電子郵件或打電話與各位編輯聯(lián)系。ChinaByte操作方式上的正規(guī)性從各個細小的方面都能體現(xiàn)出來。如此正規(guī)的網(wǎng)站,其內容的可信度肯定會比較大。

5.2.2 可以從URL上可以得到一些該網(wǎng)站的線索
比如,凡帶“~”符號的大都是個人主頁。從域名的后綴上也可以得到一些大概的線索。
.edu是教育類網(wǎng)站,既可能是嚴肅的學術研究,也可能學生隨意制作的主頁。
.gov或.gov.cn是政府網(wǎng)站,一般比較權威,可靠,不會隨意發(fā)布不準確的信息。
.com或.com.cn是商業(yè)網(wǎng)站,最常見,在介紹自己的產(chǎn)品時往往會夸大其辭,所以要注意“批判”性地接受。
.net網(wǎng)絡服務公司,為商業(yè)或個人用戶提供服務。
.org一般是非營利性組織,其觀點可能帶有傾向性
可以點到該站點的主頁上,看一下該組織的相關資料
如果頁面上沒有其主頁的鏈接,可以直接訪問域名前部的地址,那往往就是該網(wǎng)站的首頁。http://www..chinabyte.com/staticpages/builder/builder_schedule/asp.html這一大串網(wǎng)址,你只需要把地址中“/staticpages”以后的所有字母都刪去,只留http://www.chinabyte.com,然后敲回車,往往就能看到該網(wǎng)址的首頁

6 Google搜索網(wǎng)站的設置方法 
Q:如何全面的了解Google.com?
A:查看網(wǎng)站相關頁http://www.Google.com/about.html”。
Q:如何切換Google.com的初始語言界面?
A:點擊搜索欄右邊的“使用偏好”(Preferences),選擇“界面語言”(Interface Language)中你期望的語言,點擊最下面的“設定使用偏好”(Save Preferences)按鈕。需要提醒的是,Google用cookie記錄這個偏好,所以如果你把瀏覽器的cookie功能關掉,就無法進行設定。   
Q:如何設定每頁搜索結果顯示數(shù)量?
A:同上,進入使用偏好,在該頁的“查看結果”(Number of Results)選擇顯示結果數(shù),數(shù)目越大,顯示結果需要的時間越長,默認是10項。
Q:搜索到的鏈接無法打開怎么辦?
A:鏈接無法打開的原因很多,比如網(wǎng)站當機,或者ISP過濾等,可以點擊Google的“網(wǎng)頁快照”查看在Google服務器上的網(wǎng)頁緩存。   
Q:打開搜索結果的鏈接,可是該頁面太大,很難找到一下子找到目的資料怎么辦?
A:直接打開“網(wǎng)頁快照”, Google會把關鍵詞用不同顏色標記出來,很容易找到。

參考文獻
[1]張曉林.科研環(huán)境對信息服務的挑戰(zhàn)[J].中國信息導報,2003.918-22
[2]粱春曉。搜索引擎的價值來源[J].中國傳媒科技,2003.9.25-26
[3]李子臣. Google的成功對網(wǎng)絡信息界的啟示[J] .中國傳媒科技,2003.8.22-24
[4]林中.利用Google進行專題信息檢索[J].情報科學,2003.11.1207-1209
[5][6]天涯.Google搜索引擎的使用方法 [J]. 博客中國(Blogchina.com),2003.11.14
[7]徐家坤.搜索引擎的實用檢索技巧[J].科技情報開發(fā)與經(jīng)濟,2003.1.96-98
[8][9]馬得.網(wǎng)上搜索技巧[J].中國數(shù)據(jù)通信,2002.9.104-107

作者簡介 李子臣(1969--)男,山東莘縣人。山東大學圖書館學系畢業(yè),現(xiàn)為山東理工大學圖書館館員,已發(fā)表論文74篇,中文核心期刊論文20篇。
 



 

 

Copyright © 2003 SoWang.com.All Rights Reserved
中文搜索引擎指南網(wǎng)
 版權所有