
|
民國(guó)時(shí)候拿自個(gè)寫的東西當(dāng)翻譯作品發(fā)表,得到的評(píng)價(jià)“譯筆流暢”,以假亂真總得有點(diǎn)譜兒,所以這位仁兄的寫作桌上放著日本地圖。這幾天在亞馬遜網(wǎng)上書店看了部分搜索類圖書,有些想法,拉拉雜雜寫下來。需要說明的是,原書都沒看過,依據(jù)是每本書的Sample
Pages。
(1)《網(wǎng)絡(luò)搜索大全》(Find it Online: The Complete
Guide to Online Research by Alan M. Schlein)
亞馬遜最新的網(wǎng)絡(luò)搜索圖書。作者Alan M. Schlein是華盛頓新聞?dòng)浾撸覀兇筇岵聹y(cè)得出本書的特色會(huì)是哪些。豐富的新聞資源外,還有找人、地圖、黃頁(yè)、政府網(wǎng)站,在政府資源這一章里,作者不厭其煩地羅列出各個(gè)州的政府站點(diǎn)。可以想像得到,關(guān)于網(wǎng)絡(luò)資源準(zhǔn)確性、可信度、權(quán)威性的評(píng)估一章,也不會(huì)差到那兒。
全書共分14章:1.Creative Uses of the Internet; 2.The
Basics--Internet Terminology & Concepts; 3.Framing Your
Search Strategy; 4.General Search Tools; 5.Specialized Tools;
6.Government Resources; 7.Public Records--The Information Trail;
8.News Resources Online 9.Business Tools--Business Resources;
10. International Research; 11.Managing & Filtering
Information--Keeping-Up Tools; 12.Evaluating Accuracy,
Credibility, and Authority; 13.Search Strategies and Sample
Searches; 14.Privacy & Protection
本書第1版獲得Irvin獎(jiǎng),今年8月份出的是第3版,有家研究搜索的網(wǎng)站Pandia又給它頒了次獎(jiǎng),亞馬遜的13篇讀者評(píng)論也頗多贊譽(yù)之詞,“太好了”、“放在鍵盤邊上的書”、“珍寶”。。。不一而足,還有人喊出了Eureka。作為讀者,如果挑剔一些的話,可以認(rèn)為整本書內(nèi)容不過是給各種搜索工具與網(wǎng)絡(luò)資源羅列了一張張清單。作為新聞?dòng)浾撸谒阉鞣矫婵隙ㄓ胁簧侏?dú)特的“旁門左道”,這可以用來彌補(bǔ)對(duì)主要搜索工具及搜索策略介紹的不足。正所謂,戲不夠,歌來湊。對(duì)多數(shù)普通網(wǎng)絡(luò)用戶來說,本書不應(yīng)該是第一本搜索入門讀本,至少它不會(huì)教你搜MP3。
(2)《看不見的網(wǎng)頁(yè)》(The Invisible Web: Uncovering
Information Sources Search Engines Can't See by Chris Sherman,
Gary Price)
2001年3月第二屆“網(wǎng)絡(luò)小姐”評(píng)選中,有道測(cè)試題是根據(jù)駕照的戶主姓名和號(hào)碼,3分鐘內(nèi)在網(wǎng)上搜索相關(guān)的信息,結(jié)果沒有一個(gè)選手找到正確答案。用搜索引擎肯定查不到,應(yīng)該查公安交通管理局的違章數(shù)據(jù)庫(kù)。這就是invisible
web。那個(gè)時(shí)候國(guó)外也很少有人談invisible web,BrightPlanet公司的那個(gè)Deep
Web白皮書還沒出來呢。當(dāng)然,不知道invisible web這個(gè)詞并不意味著不會(huì)用,以前我分類外文書遇到Personal
finance、Strategic management拿不準(zhǔn)的時(shí)候,就一邊念叨著“三人行,必有我?guī)煛币贿叢橹袊?guó)國(guó)家圖書館、北大圖書館以及清華圖書館的數(shù)據(jù)庫(kù)。
2001年下半年開始,一下子冒出了好幾個(gè)搜索invisible
web的網(wǎng)站。一些網(wǎng)絡(luò)搜索教程也在“搜索引擎”、“分類目錄”后增加又副冊(cè)invisible
web。invisible web搜索就是分類搜索,可以在分類搜索重點(diǎn)介紹一下,完全必要再單列。分類目錄的編制經(jīng)常被人嘲笑為沒有意義的簡(jiǎn)單勞動(dòng),invisible
web可以說是分類目錄存在意義的佐證之一。
Chris Sherman和Gary Price的The Invisible Web一書里,把“看不見”又分成四種:第一種是不透明網(wǎng)頁(yè)(The
Opaque Web),搜索引擎可以索引但沒有索引的網(wǎng)頁(yè),比如某一站點(diǎn)有大量網(wǎng)頁(yè),搜索引擎對(duì)SPIDER爬網(wǎng)頁(yè)的數(shù)量有所限制,比如還沒有收集的新網(wǎng)頁(yè),比如一個(gè)網(wǎng)頁(yè)跟其它網(wǎng)頁(yè)沒有鏈接,網(wǎng)頁(yè)的主人又沒有把網(wǎng)址提交給搜索引擎等;第二種是私人網(wǎng)頁(yè)(The
Private Web),本來是可以索引的,由于網(wǎng)頁(yè)主人加了口令保護(hù)、禁止索引的網(wǎng)站標(biāo)記、robots文件,便將SPIDER拒之門外。第三種是專用網(wǎng)頁(yè)(The
Proprietary Web),某些網(wǎng)頁(yè)只有注冊(cè)用戶才能瀏覽,SPIDER不會(huì)填表,當(dāng)然也就沒法收集。第四種是搜索引擎因?yàn)榧夹g(shù)原因無法收集索引的真正看不見的網(wǎng)頁(yè)(The
Truly Invisible Web)。到目前為止,大部分搜索引擎能夠收集索引的還是HTML等語(yǔ)言編寫的常規(guī)網(wǎng)頁(yè),只有GOOGLE才能索引PDF、postscript跟Microsoft
Office文件。(這兒應(yīng)該修正一下,ALLTHEWEB也能索引PDF文件了。)再就是數(shù)據(jù)庫(kù)訪問形成的動(dòng)態(tài)網(wǎng)頁(yè)了,SPIDER一方面不敢陷進(jìn)無休止的圈子,更主要的是它不能填寫查詢表單,自然也爬不進(jìn)數(shù)據(jù)庫(kù)。傳統(tǒng)搜索引擎只能搜索全部網(wǎng)絡(luò)信息的16%,在剩下的84%中,有不少的數(shù)據(jù)庫(kù)還是非常有價(jià)值的,這就成了Chris
Sherman和Gary Price寫這本書的理由。
全書共27章:1.The Internet and the Visible Web;
2.Information Seeking in the Visible Web; 3.Specialized and
Hybrid Search Tools; 4.The Invisible Web; 5.Visible or
Invisible? 6.Using the Invisible Web; 7.Case Studies; 8.The
Future: revealing the Invisible Web; 9.The Best of the Invisible
Web; 10.Art and Architecture; 11.Bibliographies and Library
Catalogs; 12.Busines and Investing; 13.Computers and Internet;
14. Education; 15.Entertainment; 16. Government Information and
Data; 17.Health and Medical Information; 18.U.S.and World
History; 19.Legal and Criminal Resources; 20.News and Current
Events; 21.Searching for People; 22.Public Records; 23.Real-time
Information; 24.Reference; 25.Science; 26.Social Sciences;
27.Transportation
一半的篇幅都是羅列各種資源,這些資源在大部分Invisible
Web網(wǎng)站目錄都可以檢索到。另一小半的篇幅是網(wǎng)絡(luò)信息搜索的老生常談,還是從阿帕網(wǎng)家史講起的。本書的作者之一Chris
Sherman是一家咨詢公司Searchwise的總裁,并主持About.com的the
guide to Web searching,另一位Gary Price是喬治華盛頓大學(xué)的圖書館員。
|