中文搜索引擎指南網

搜網全能搜,幫您一鍵實現對百度、google谷歌、360搜索、搜狗、搜搜等搜索引擎及影視娛樂、圖片、音樂歌曲、問題知識、論壇、微信、微博、淘寶網上購物等熱門網站搜索,方便快速找到您需要的東西!

 

·繁體版本 
·收藏本站
·網站地圖

  首頁 - 搜網全能搜 - 搜索引擎大全 - 搜索入門到精通 - 搜索引擎登錄 - 搜索愛好者
 
 
首頁>>搜索技巧>>正文

 

 網上研習信息檢索

陳鴻標 博士 (1999年11月)  2002-9-14 17:36:39

    


“你要的我統統都給你! ” — 題記 

在選擇研究方向、確定研究課題時,了解其現狀和發展趨勢是至關重要的。交流渠道的滯塞和信息源的匱乏是一個國家或地區科技水平落后于世界的主要原因。 因特網的普及,為我們開辟了一條通向世界的天塹通途。 
因特網上的信息豐富到讓人感到意外! 最讓學人欣喜若狂的是,它可以提供在傳統圖書館和書店里找不到寶貴資料。筆者的研究方向是信息檢索。在選定博士論文題目時,曾得大益于因特網,從中取得的資料大大多于在國內搜羅所得,而且得來更簡捷容易。可以毫不夸張地說,沒有因特網,就沒有筆者的論文選題。 
網上資源雖然豐富,但并非唾手可得。這就好比地球上的寶藏需要人帶著工具去勘探開發。網上有許多這樣的尋寶工具——網絡搜索引擎。只要輸入若干描述查找目標的關鍵詞,就可以得到相關的超級鏈接地址。但是,有時所得的鏈接太多,難以一一細看。以信息檢索的資料為例。用InfoSeek (www.infoseek.com) 的搜索引擎,輸入“Information Retrieval”進行搜索,得到的相關鏈接達幾十萬之多!要在如此眾多的資源中找到所需的信息,仍如大海撈針般困難。如果有事先編排好的資源簿就好了!這就好比尋寶人得到了一張藏寶圖。對著這張“藏寶圖”,按圖索驥,就可以把寶藏收歸己有。 
因特網上真有這樣的“藏寶圖”。筆者也希望本文能為信息檢索研究者,特別是漢語信息檢索技術的研究者們提供一張盡量祥盡的網上資源地圖,以減輕“撈針”之苦。 

I. 從一張“藏寶圖”開始 

在http://web.syr.edu/~diekemar/ir.html,美國人Diekemar有一張甚為詳細的信息檢索研究資料的“藏寶圖”。Diekemar把他收集的資源鏈接分成以下十類: 
1. bibliographies (文獻目錄) 
2. conferences and workshops (年會、討論會) 
3. courses (網上課程) 
4. dissertations (學位論文) 
5. FAQs and list archives(常見問題答疑和郵件群資料存檔) 
6. journals(學術刊物) 
7. organizations and special interest groups(機構和興趣小組) 
8. papers and books(論文和書籍) 
9. projects and labs(研究項目和實驗室) 
10. resources (其它IR資源) 

在這些大類下,分別有具體的資源鏈接及其簡要說明,是筆者見到的最為齊全的收集。 
下面,讓我們從它開始,一起去探秘吧。 

II. 參加網上信息檢索課程 

對于新手,入門的最佳辦法是聽老師講課。這樣的課程在因特網上不但有,而且可以免費參加。 
下列課程中,課程1至4是英語的,課程5主要是德語,但它最為方便和完整,因為整個教材和講稿已經用Postcript 格式制作成一個或多個文件。可以把它們下載到自己的機器上慢慢研習。 
剛剛接觸信息檢索的初學者可以先看課程1。那是IR的簡單介紹。然后學習課程2。課程3、4可做參考。而懂德語的則可參加課程5。 
課程1:http://pi0959.kub.nl:2080/Paai/Onderw/Barcpaai/barcpaai.html 
荷蘭Brabant大學講師J.J. Paijmans( http://pi0959.kub.nl:2080/Paai/engels.html)給大學一年級的新生開的信息檢索課。比較淺。 
課程2:http://pi0959.kub.nl:2080/Paai/Onderw/Ir/ir.html 
也是Paijmans 開的課,對象是大學高年級學生。從1月30號到5月,每星期一課。他采用Norbert Fuhr的教材(見課程4)。講稿用超文本的形式,其中有許多有用的資源鏈接。對IR的各種模式有比較詳細的介紹。 
課程3:http://www.cs.bilkent.edu.tr/~david/cs533/cs533.html 
主講老師是土耳其Bilkent 大學的David Davenport (http: //www.cs.bilkent.edu.tr/~david/ david.html )。重點放在信息的組織上。可惜的是上面只有他在大學所開課程的介紹,沒有實質的課程內容可供瀏覽。 
課程 4:http://ei.cs.vt.edu/~cs5604/ 
這里有Virginia Polytechnic Institute and State University 的教師Ed Fox從1994年至1996年的授課講稿。他開的課程名稱是: Information Storage and Retrieval。講稿全部是超文本格式。其中有一份很好的IR術語表 
課程5:http://ls6.informatik.uni-dortmund.de/ir/teaching/ 
這是德國Dortmund大學的網上課程網頁。這里的信息專業的課程資料非常齊全,自成系統。總共有下面幾門課: 
1. MMIS : Multimedia Information Systems 
2. IR : Information Retrieval 
3. IS 95/96: Information Systems WS 95/96 
4. IS 97/98: Information Systems WS 97/98 
這些課程的材料全部是Postcript格式的文件。 

III. 了解最新動態 

信息檢索的研究在國外非常熱鬧,用如火如荼來形容一點也不過分,因而網上召開的學術年會(Conference)和研習會(Workshop)也很多。如果想了解信息檢索的最新動態,那么,一定要到下面這些地方看看: 
[$#61599] SIGIR85-96 : http://www.ubilab.ubs.ch/sigir96/welcome.html 
這是美國計算機學會信息檢索特別興趣小組的網址(the Special Interest Group on Information Retrieval of the Association for Computing Machinery)。該小組每年碰一次頭,共同研討信息檢索的研究和發展。到1996年為止,已經舉辦了19屆。1991年及以后各屆年會的論文都可以免費下載,文件是PDF(Portable Document Format) 。 
[$#61599] TREC :http://www-nlpir.nist.gov/TREC/ 
TREC(The Text REtrieval Conference)由美國國家標準和技術協會(the National Institute of Standards and Technology)和國防部高級研究計劃署( the Defense Advanced Research Projects Agency )聯合舉辦。兩個機構每年碰一次頭,展示各自的研究進展,互相切磋。有各屆論文集可供下載。 
[$#61599] MUC :http://cs.nyu.edu/cs/faculty/grishman/muc6.html 
于1995年11月召開的MUC (Message Understanding Conferences)已經是第五屆。其宗旨是評價當今信息提取技術的水平,促進機器理解信息技術的發展。由美國國防部高級研究計劃署資助。 
[$#61599] IR, Logic & Uncertainty :http://www.dcs.gla.ac.uk/logic95/ 
顧名思義,這個研習會主要探討用基于邏輯的模式處理信息不確定性這一難題。1995年9月舉行了第15期,由蘇格蘭學者Mounia Lalmas主持。 
[$#61599] Cross-Linguistic IR :http://www.rxrc.xerox.com/research/mltt/DMHead/CLIR/ 
多語信息檢索有廣闊的前景。因而這個于1996年8月在瑞士舉行的跨語言信息檢索研討會倍受關注。這個論題在我國有特別高的研究價值。當前因特網上英語資訊多于漢語資訊,多語檢索技術可以使我國用戶更方便快捷地找到所需信息,也可以讓外國用戶享用漢語資訊。 

對于以上的會議,研究者們應特別留意。在每次開會前,他們會發布會議的主題和日程安排。其論文選題指南往往能反映當前的研究熱點和趨勢。 

IV. 查閱文獻資料 

學術研討會收集的論文數量畢竟有限。大量的文獻以其他的途徑發表,例如,學術期刊。現在,許多期刊建立了自己的網站,但他們一般不會把最新一期刊物的全部內容放在網上供人免費下載,往往只將其目錄登載出來。有的則會把以前的內容掛在網上,供人下載。有關信息檢索的專業刊物主要有以下幾家: 
[$#61599] D-Lib :http://www.dlib.org/ 
月刊。登載電子圖書館研究方面的消息、評論、簡報等。 
[$#61599] IP&M :gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EI06 
Information Processing and Management (信息處理和管理) 
[$#61599] JASIS:gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EJ02 
Journal of the American Society for Information Science (美國信息科學協會會刊) 
[$#61599] JDOC :gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EJ05 
Journal of Documentation (文獻工作) 
[$#61599] Wired :http://www.hotwired.com/frontdoor/ 
《連線》雜志。 

雜志雖好,但其文獻豐富程度遠遠比不上一些專門收集電子文獻的資料庫。有兩個網上圖書館是筆者最喜歡的所在: 

[$#61599] NCSTRL(Networked Computer Science Technical Report Library): http://www.ncstrl.org/ 
這個資料中心由具有博士學位授予權的大學或者研究機構組成。實際上,資料中心的服務器并不存放文獻資料。它只是把各成員的機器連接了起來,形成一個網絡。該中心有下面幾個特點: 
1. 檢索方便。每篇文獻都有摘要供全文搜索。除了輸入關鍵詞檢索外,還支持題目、作者、時間等方式的檢索。檢索結果以成員機構為單位分組排列。所有符合查詢條件的文獻題目和作者姓名都在一個頁面中顯示。這樣有利于保存和打印檢索結果。 
2. 資料豐富。用關鍵詞“Information Retrieval”檢索,結果多達十幾頁。其他論題如自然語言處理(NLP)的資料也非常豐富。 
3. 格式多樣、查看方便。可供下載的文件格式有Postcript、PDF和純文本格式。有的文件是經過壓縮的,雖然它的后綴名也是.ps。打開這些文件時要先解壓縮。另一個要注意的是,有的文獻是用掃描儀掃成圖片,再用軟件轉成一種叫Postcript Level 2的格式。這種文件只能用Postcript打印機打印,不能用Ghost View打開。文獻除了可以下載外,還可以在線瀏覽,很是方便。 
[$#61599] Computation and Language E-print Archive :http://xxx.lanl.gov/cmp-lg/ 
這個電子資料庫主要收集計算語言學、自然語言處理、語音處理等相關領域的文獻。也有檢索功能,文件格式比NCSTRL的還要多。它有個特點,就是把收到的文章按月排列,因此最新資料可一目了然。 

除了大型資料庫外,一些個人網頁上也有很好的資料,如自己的學位論文、手稿、未發表的文章,甚至整本書: 

[$#61599] “Information Retrieval By Plausible Inferences ”:http://ocelot.cat.syr.edu/~farhad/dissertation.html 
Farhad Oroumchian (http://ocelot.cat.syr.edu/~farhad/)1995年的學位論文。 
[$#61599] “Nichtlineares Information Retrieval in der Juristischen Informationssuche ”:http://www.fask.uni-mainz.de/user/ krueger/dissweb/Diss-00.html 
Frank Krueger的畢業論文(德語) 
[$#61599] “Information Retrieval” :http://www.dcs.glasgow.ac.uk/Keith/Preface.html 
信息檢索領域很出名的一本專著。重點介紹用概率研究信息檢索的方法。作者是C. J. van Rijsbergen。全文可免費下載。文件有Postcript和超文本兩種格式。 
[$#61599] "What Do People Want from Information Retrieval?": 
非常值得一看。能幫助了解信息用戶的需求,確定研究方向。作者是Croft。 
[$#61599] Huibers:http://www.cs.ruu.nl/people/theo/publ.html 
這里有Utrecht 大學Theo Huibers 的大作。 
[$#61599] Chris Plaunt:http://bliss.berkeley.edu/papers/ 
Chris Plaunt(http://bliss.berkeley.edu/)專著或合著。全部是信息檢索方面的內容。 
[$#61599] ……等等 

V. 查找文獻目錄 

網上電子資料庫收集的文獻當然不可能包括所有的文獻資料。許多以前出版的論著由于各種原因,不能以數碼形式出現在網上。要查找這些文獻也有辦法。在許多地方都有文獻目錄,詳細列出一個或幾個專題的相關論著: 

[$#61599] http://mansci1.uwaterloo.ca/~jjiang/biblio.html 
這是Jay Jiang(http://mansci1.uwaterloo.ca/~jjiang/)整理的文獻目錄。主題包括文檔結構和模式(document structure and text modeling)、信息檢索模式(IR modeling)、信息提取模式(access methods)、分布式信息檢索(distributed IR)和因特網等。 
[$#61599] http://www-inf.enst.fr/~rungsawa/irrs.html 
由Arnon Rungsawang(http://www-inf.enst.fr/~rungsawa/)提供。大約有255條,沒有按主題排序。 
[$#61599] http://www.seas.gwu.edu/student/chulee/bib.html 
這份書單收集的書目涵蓋面很廣,包括: query processing, compression and signature, N-grams theory, probabilistic IR, data structure and indexing, experimental and performance, thesaurus, full text analysis, vector space, other retrieval strategies, pattern matching, applying distributed environment to IR, applying parallel environment to IR, IR applications, linguistics, and information extraction。由Chuleerat Jaruskulchai(http://www.seas.gwu.edu/student/chulee/)提供和維護。 
[$#61599] http://www.sils.umich.edu/~mjpinto/ILS609Page/Bibliography/IRBibliography.html 
這個由Martha Pinto(http://www.si.umich.edu/~mjpinto/)提供的參考書目主要涉及以下領域: uses and users, relevance, design of IR systems, selection of information resources, information representations, file organization, question analysis and search strategy, dissemination and access, and digital libraries。 
[$#61599] http://joinus.comeng.chungnam.ac.kr/~dolphin/db/indices/a-tree/s/Salton:Gerard.html 
著名的信息檢索專家Gerard Salton 提供的有關數據庫系統和邏輯編程方面的著作和出版物目錄。 
[$#61599] http://superbook.bellcore.com/~std/LSI.html 
Latent Semantic Indexing (LSI) 是一種信息檢索的新技術。通過統計手段,LSI可以把雖然不含查詢字串但卻相關的文檔提取出來,和“概念檢索”有相同之處。 

VI. 尋覓良師益友—參加討論組 

如果在上面這些地方都沒有找到想要的資料,或者有別的疑難問題無法解決,那么,可以到郵件討論組里尋求答案。那里有許多樂于助人的專家。 
一群對相同論題感興趣的網友,通過電子郵件互通信息、討論問題,這樣就形成了因特網上非常流行的郵件群討論組(mailing list)。只要對某個論題感興趣而且有電子郵件地址就可以參加該論題的討論組。方法是,向接受申請加入的地址(subscription address)發一封電子郵件,郵件的主題(Subject)為空,正文一般是:"subscribe 某某討論組" 。等收到回復后即可以向發表意見的地址(Submission address)投稿,也能收到組員傳送的信息。 
要特別注意的是,必須分清“申請地址”和“投稿地址”。 想加入或退出討論組時,向“申請地址”發信。想提問或發表意見時,向“投稿地址”發信。 
現在的郵件群討論組一般由程序自動管理。管理程序除了接受申請和退出請求外,還有其它功能,如查閱存檔,暫停服務等。要詳細了解有哪些命令(commands)以及這些命令的用法,一般可向“申請地址”發一封求助信,正文寫上"help"即可。正常情況下在幾分鐘之內可得到回復。如果是人工管理的討論組,則可向管理人員寫一封簡短的申請信。 
有關信息檢索(Information Retrieval)的郵件討論組有下面幾個。這些討論組似乎沒有其他領域的討論組活躍。這也許是因為信息檢索的研究重在實踐,無須太多爭論的緣故吧。 

1) 討論組名稱:IIRS 
簡介: 以色列信息檢索專業人員的興趣小組。 
申請地址: listserv@taunivm.tau.ac.il 
投稿地址: IIRS@taunivm.tau.ac.il 
聯系地址: RAFARBER@weizmann.weizmann.ac.il (Miriam Farber) 
加入: SUBscribe IIRS 姓名 
退出: SIGNOFF IIRS 

2) 討論組名稱:IR 
簡介: CEPIS 成員的討論組。 
申請地址: mailbase@mailbase.ac.uk 
投稿地址: IR@mailbase.ac.uk 
聯系地址: ir-request@mailbase.ac.uk 
加入: join IR 姓 名 
退出: UNSUBscribe IR 
3) 討論組名稱:IR-L 
簡介: 最開放、活躍的討論組。主要成員來自ACM SIGIR 。談論話題涉及信息檢索的方方面面,和人工智 能、數據庫、圖書館科學和語言學有密切的聯系。發送的信息是人工整理好的。每周發送一期。 
申請地址: ncg@dla.ucop.edu 
投稿地址: ncg@dla.ucop.edu 
聯系地址: ncg@dla.ucop.edu (Nancy Gusack) 
加入: 和Nancy Gusack聯系 
退出: 和Nancy Gusack聯系 
4) 討論組名稱:NIR-IT-L 
簡介: 意大利網絡信息檢索活動組。主要成員是信息系統管理員。工作語言是意大利語。不過,如果用英語提問也可以被接受。 
申請地址: listserv@itocsivm.csi.it 
投稿地址: NIR-IT-L@itocsivm.csi.it 
聯系地址: METITIER@itocsivm.csi.it (Fabio Metitieri) 
加入: subscribe NIR-IT-L 
退出: unsubscribe NIR-IT-L 

5) 討論組名稱:VNIT-L 
簡介: 越南語信息檢索。只有在被邀請的情況下才能參加。在gopher:// cheops .anu.edu.au / 7waissrc%3a/Coombs-db/ANU-VNIT-L.src 處有存檔可供查閱。 
聯系地址: rob@coombs.anu.edu.au 

另外,還有專門研討信息系統(Information System)的郵件群討論組。這些討論組似乎要比信息檢索的活躍。 更詳細的介紹可到http:// www.n 2h2.com/ KOVACS/ CD/ S0029s.htm 和http: // www. n2h2. com /KOVACS/ CD/ S0030s.htm 查看。 
有些討論組會把以往的資料收集起來放在網上公人查閱。下面這個地方就有這方面的材料:http://www.dcs.gla.ac.uk/idom/irlist/ 。可以按年度進行檢索。 

VII. 參觀公司、實驗室和研究機構 

紙上談兵終是虛!要了解信息檢索研究的火熱程度以及別人實際上已經做了什么,那非得到他們的網站去看看不可。 
從事各種信息檢索研究的大學院系、研究機構和實驗室,還有提供信息服務的商業公司在因特網上多不勝數。在他們的網站上可以發現許多有價值的東西。例如,從那些研究項目的介紹中可以觸摸到潮流的脈搏;而那些別出心裁的系統界面和功能則能使靈感迸發…… 

1) ASIS:http://www.asis.org/ 
美國信息科學協會的網站(the American Society for Information Science)。 
2) SIGIR:http://www.acm.org/sigir/ 
美國計算機學會信息檢索特別興趣小組的網址(the Special Interest Group on Information Retrieval of the Association for Computing Machinery)。 
3) TIPSTER:http://www.tipster.org/ 
美國國防部高級研究計劃署(DARPA )致力于把最新技術應用于信息檢索領域。這是他們的實踐基地。 
4) CIIR:http://ciir.cs.umass.edu/info/ciirinfo.html 
位于 University of Massachusetts的美國智能信息檢索中心(The National Center for Intelligent Information Retrieval)。 
5) The Information Retrieval Group :http://www.dcs.gla.ac.uk/ir/ 
由Keith van Rijsbergen率領的信息檢索研究小組,隸屬Glasgow 大學的計算科學系(Department of Computing Science )這個小組理論和實踐并重,旨在建造一個高效、新穎、成功的多媒體信息檢索系統,為終極用戶服務。 
6) Natural Language Processing and Information Retrieval Group :http://www-nlpir.nist.gov/ 
美國國家標準和技術協會(the National Institute of Standards and Technology)屬下的自然語言處理和信息檢索研究小組。 
7) Information Filtering Project :http://www.enee.umd.edu//medlab/filter/filter_project.html 
“信息過濾研究”(the Information Filtering Project)是University of Maryland 、Medical Informatics and Computational Intelligence Laboratory 和 the Computational Linguistics and Information Processing (CLIP) Lab聯合進行的合作研究項目。目標是開發一種給普通人使用的、高性能的信息自動處理系統。 
8) Proteus:http://cs.nyu.edu/cs/faculty/grishman/proteus.html 
這個名為Proteus(希臘海神)的研究項目有紐約大學計算機科學系的Ralph Grishman主持。 
9) NLP lab :http://www-nlp.cs.umass.edu/ 
這個實驗室在以下領域的研究中非常活躍:句子和篇章分析(sentence analysis, discourse analysis)、基于語料庫的文本理解和信息提取、自然語言處理軟件開發等。是一個既有學術傳統,又有商業氣息的研究機構。 

至于提供信息服務的商業機構,則多不勝數!除了有名的Yahoo!、InfoSeek 外,還有筆者比較喜歡的Inference Find (www.inference.com) 和 Hotbot (www.hotbot.com)。 Inference Find 采用的是元搜索技術。搜索的結果按網站的類別排列。如果搜索內容是學術性的,那么就可以不看與此無關的網站的搜索結果。Hotbot公司的搜索引擎在97年度的比賽中擊敗InfoSeek、Excite等對手,榮獲冠軍,大有后來居上的氣勢。 

VIII. 免費下載軟件 

網上提供給用戶免費使用的信息檢索軟件并不多。即使有這些軟件,對用戶來說也不會有多大用處,因為再好的檢索軟件也得有豐富的數據資源才能充分發揮作用。不時會有一些公司把客戶前端軟件免費奉送,但訪問數據庫時卻需要收費。不過也有例外。 
IBM公司最新開發出一種圖像檢索系統。它可以根據圖像色調、明暗等方面的特點,判斷是否符合用戶的要求。IBM公司把這種叫做QBIC(Query by Image Content)的系統免費提供給用戶試用,試用期為90天。在 http://service.software.ibm. com/ dl/ eqbic / qbic-l可以下載。 
它還自帶兩個小小的圖片庫,并且有各種版本,包括Ms Dos、Unix, Linux, Macintosh, Os/2等。不過,系統的安裝和使用比較麻煩。 
華盛頓大學有一個用戶前端軟件WinWillow可供免費下載:http:// www. washington. edu/ willow/ getting.html。但要使它能成功地訪問指定的數據庫,配置起來也不方便。 

IX. 再尋幾張“藏寶圖” 

因特網上有關信息檢索的資訊當然不止上面介紹的那些。由于信息檢索和語言處理有千絲萬縷的關系,因此在許多和自然語言處理有關的網站上都會有這方面的信息。例如有一個叫做Human Language Pages的網頁(http://www.hardlink.com/~chambers/HLP/)收集了許多與人類語言有關的網上資源鏈接。在該處還可以下載一本題為 Survey of the State of Art in Human Language Technology 的文集。里面專門有一章講文檔處理(Document Processing)。另外還有一節講多語信息檢索。集子的第12章列出了許多語料庫、自然語言處理領域的研究項目的網上地址。非常有價值。 
在Glasgow大學的信息檢索研究小組也把多年收集的 IR 資源放在:http:// www. dcs. gla. ac. Uk / idom/ir_resources/ 。 
多媒體信息檢索現在也很熱門。這里有專門收集與此有關的資源的網頁:http: // www. ee. umd. edu/ medlab /mlir/mlir.html。它是由 Doug Oard.(http://www.glue.umd.edu/~oard/Welcome.html)整理的。 

X. 自己尋寶 

如果還嫌上面介紹的不夠多,那么可以自己拿著尋寶利器——網絡搜索工具到因特網上盡情挖掘。至于用那一種工具最好則因人而異。可以選自己比較熟悉的搜索引擎,輸入關鍵詞進行檢索。除了用"information retrieval"外,還可以用:information access, text retrieval, document retrieval, automatic text processing, full-text retrieval,free-text retrieval, natural language processing等等相關詞語作為關鍵詞。就漢語而言,術語“情報檢索”似乎比“信息檢索”更為流行。全文檢索、文獻檢索、數據庫檢索、聯機檢索、文檔檢索等等也可以作為關鍵詞。可惜的是,國內的互聯網上很少有這方面的文獻資料! 

因特網上的信息資源經常變化,信息在不斷增加的同時,偶爾也會有“人去樓空”的情況出現。此時不必驚詫,只要反復求索,定有所獲。 
為了查閱方便,筆者把本文提到的資源匯總成速查表附于文后。 

附:信息檢索資源速查表 

課程 
http://pi0959.kub.nl:2080/Paai/Onderw/Barcpaai/barcpaai.html 荷蘭Brabant大學講師J.J. Paijmans開設的IR初級入門課 
http://pi0959.kub.nl:2080/Paai/Onderw/Ir/ir.html Paijmans 為大學高年級學生開的課 
http://www.cs.bilkent.edu.tr/~david/cs533/cs533.html 土耳其Bilkent 大學的教師David Davenport所開課程的介紹 
http://ei.cs.vt.edu/~cs5604/ Ed Fox從1994年至1996年的授課講稿 

學術年會、研討會 
http://www.ubilab.ubs.ch/sigir96/welcome.html 美國計算機學會信息檢索特別興趣小組(SIGIR)1996年會 
http://www-nlpir.nist.gov/TREC/ The Text REtrieval Conference 
http://cs.nyu.edu/cs/faculty/grishman/muc6.html The Sixth Message Understanding Conferences 
http://www.dcs.gla.ac.uk/logic95/ 探討用基于邏輯的模式處理信息不確定性 
http://www.rxrc.xerox.com/research/mltt/DMHead/CLIR/ 跨語言信息檢索研討會(Cross-Linguistic IR) 

學術期刊、電子文獻庫 
http://www.dlib.org/ 月刊D-Lib,電子圖書館研究 
gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EI06 Information Processing and Management (信息處理和管理) 
gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EJ02 Journal of the American Society for Information Science (美國信息科學協會會刊) 
gopher://ukoln.bath.ac.uk:7070/11/BUBL_Main_Menu/E/E2/E2EJ05 Journal of Documentation (文獻工作) 
http://www.hotwired.com/frontdoor/ Wired (《連線》) 
http://www.ncstrl.org/ NCSTRL(Networked Computer Science Technical Report Library) 
http://xxx.lanl.gov/cmp-lg/ Computation and Language E-print Archive 

具體論文、著作 
http:// www.dlib.org/ dlib/november95/11croft.html “What Do People Want from Information Retrieval?” 
http://ocelot.cat.syr.edu/~farhad/dissertation.html “Information Retrieval By Plausible Inferences” 
http://www.fask.uni-mainz.de/user/ krueger/dissweb/Diss-00.html “Nichtlineares Information Retrieval in der Juristischen Informationssuche ” 
http://www.dcs.glasgow.ac.uk/Keith/Preface.html “Information Retrieval” IR專著,重點介紹概率法 
http://www.cs.ruu.nl/people/theo/publ.html Theo Huibers的多篇論著 
http://bliss.berkeley.edu/papers/ Chris Plaunt的多篇論著 

文獻目錄 
http://mansci1.uwaterloo.ca/~jjiang/biblio.html Jay Jiang整理 
http://www-inf.enst.fr/~rungsawa/irrs.html Arnon Rungsawang整理,沒有分類 
http://www.seas.gwu.edu/student/chulee/bib.html Jaruskulchai整理和維護,涵蓋面很廣 
Http://www.sils.umich.edu/~mjpinto/ILS609Page/Bibliography/IRBibliography.html Martha Pinto整理和維護 
http://joinus.comeng.chungnam.ac.kr/~dolphin/db/indices/a-tree/s/Salton:Gerard.html 著名的信息檢索專家Gerard Salton 提供 
http://superbook.bellcore.com/~std/LSI.html 專收有關Latent Semantic Indexing 的書目 

郵件群 
listserv@taunivm.tau.ac.il, IIRS@taunivm.tau.ac.il IIRS:以色列信息檢索專業人員的興趣小組 
mailbase@mailbase.ac.uk,IR@mailbase.ac.uk IR:CEPIS 成員的討論組 
ncg@dla.ucop.edu,ncg@dla.ucop.edu IR-L:最開放、活躍的討論組 
listserv@itocsivm.csi.it,NIR-IT-L@itocsivm.csi.it 意大利網絡信息檢索活動組 
http:// www.n 2h2.com/ KOVACS/ CD/ S0029s.htm IR郵件群討論組的詳細介紹 
http: // www. n2h2. com /KOVACS/ CD/ S0030s.htm 信息系統郵件群討論組的詳細介紹 
http://www.dcs.gla.ac.uk/idom/irlist/ IR-L的存檔,可按年檢索 

公司、實驗室和研究機構 
http://www.asis.org/ 美國信息科學協會的網站(ASIS) 
http://www.acm.org/sigir/ SIGIR 
http://www.tipster.org/ TIPSTER :DARPA的IR研究基地 
http://ciir.cs.umass.edu/info/ciirinfo.html CIIR: 美國智能信息檢索中心 
http://www.dcs.gla.ac.uk/ir/ Glasgow大學的計算科學系信息檢索研究小組 
http://www-nlpir.nist.gov/ 美國國家標準和技術協會信息檢索研究小組 
http://www.enee.umd.edu//medlab/filter/filter_project.html 多所大學聯合項目:Information Filtering Project 
http://cs.nyu.edu/cs/faculty/grishman/proteus.html 紐約大學的Proteus(希臘海神)的研究項目 
http://www-nlp.cs.umass.edu/ NLP lab 

免費軟件 
http://service.software.ibm. com/ dl/ eqbic / qbic-l IBM公司最新開發的圖像檢索系統(QBIC) 
http:// www. washington. edu/ willow/ getting.html 華盛頓大學的用戶前端軟件WinWillow 

其它IR資源 
http://web.syr.edu/~diekemar/ir.html Diekemar 收集的IR資源“藏寶圖” 
http://www.hardlink.com/~chambers/HLP/ “人類語言”網址 
http:// www. dcs. gla. ac. Uk / idom/ir_resources/ Glasgow大學信息檢索研究小組的收集 
:http: // www. ee. umd. edu/ medlab /mlir/mlir.html 多媒體信息檢索網上資源集錦 
http://ls6.informatik.uni-dortmund.de/ir/teaching/ 德國Dortmund大學的網上課程網頁 



Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南網  版權所有