按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:
1.
目錄式搜索引擎。早期的搜索引擎是把因特網(wǎng)中的資源服務(wù)器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進(jìn)行分類。人們要找自己想要的信息可按他們的分類一層層進(jìn)入,就能最后到達(dá)目的地,找到自己想要的信息。信息大多面向網(wǎng)站,
提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄埽孕畔?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時。這類搜索引擎的代表是:YAHOO,
Open Directory,國內(nèi)最具代表性的是搜狐分類目錄。
這是互聯(lián)網(wǎng)早期的搜索引擎形式,現(xiàn)在仍然占有重要地位。雅虎就是從一個單一的搜索引擎發(fā)展到現(xiàn)在有電子商務(wù)、新聞信息服務(wù)、個人免費(fèi)電子信箱服務(wù)等多種網(wǎng)絡(luò)服務(wù),
2.
機(jī)器搜索引擎。由大規(guī)模機(jī)器運(yùn)運(yùn)行的程序按照某種策略自動地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時、毋需人工干預(yù),缺點(diǎn)是返回信息過多,可能有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista,
Excite, Infoseek, Inktomi, FAST, Lycos,,AlltheWeb, Ask Jeeves,
Google;國內(nèi)最具代表性的是:百度,天網(wǎng),OpenFind。
目錄式搜索引擎的缺點(diǎn),隨著網(wǎng)絡(luò)信息的增長變得日益明顯。對網(wǎng)上信息搜索的需求使得從事機(jī)器搜索的研究機(jī)構(gòu)和提供搜索服務(wù)的公司在1995年以后變得異常繁榮。
3. 元搜索引擎.
這類搜索引擎沒有自己的數(shù)據(jù),它將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。這類搜索引擎的代表是WebCrawler,在實(shí)際中應(yīng)用的效果并不理想。