國(guó)外著名英文搜索引擎大全及分類
1、Google http://www.google.com
2、Yahoo http://www.yahoo.com
3、Live http://www.live.com
4、SearchMash http://www.searchmash.com/
5、ASK http://www.ask.com
6、Search http://www.search.com
7、Ask Jeeves http://www.askjeeves.com
8、AllTheWeb.com http://www.alltheweb.com
9、GuTon Search http://www.guton.com
10、HotBot http://www.hotbot.com
11、MSN Search http://search.msn.com
12、Teoma http://www.teoma.com
13、AltaVista http://www.altavista.com
14、Gigablast http://www.gigablast.com
15、LookSmart http://www.looksmart.com
16、Lycos http://www.lycos.com
17、Open Directory http://dmoz.org/
18、Netscape Search http://search.netscape.com
主要新聞搜索引擎
1、Google News http://news.google.com/
2、Yahoo News http://news.yahoo.com/
3、AllTheWeb News http://www.alltheweb.com/?cat=news
4、AltaVista News http://news.altavista.com/
5、Daypop http://www.daypop.com/
其它新聞搜索引擎
1、Ananova
http://www.ananova.com/
2、Columbia Newsblaster
http://www1.cs.columbia.edu/nlp/newsblaster/
3、Net2one
http://www.net2one.com/
4、Newsknife.com
http://www.newsknife.com
5、NewsNow
http://www.newsnow.co.uk/
6、NewsTrawler
http://www.newstrawler.com/
7、NewsTrove.com
http://www.newstrove.com/
8、Rocketinfo
http://www.rocketnews.com
9、World News Network
http://www.wn.com/
10、DailyEarth.com
http://dailyearth.com/
11、HeadlineSpot
http://www.headlinespot.com/
12、Kiosken
http://www.esperanto.se/kiosk/engindex.html
Blog 搜索引擎
1、Blogdex
http://blogdex.media.mit.edu/
2、Blogdigger
http://www.blogdigger.com/
3、Blogging Headline News
http://blogging-news.info
4、BlogStreet
http://www.blogstreet.com/
5、CRAYON (CReAte Your Own Newspaper)
http://www.crayon.net/
6、Fagan Finder: Weblogs, Journals, & RSS
http://www.faganfinder.com/blogs/
7、Feedster
http://www.feedster.com/
8、NewsIsFree
http://www.newsisfree.com
9、Syndic8.com
http://www.syndic8.com/
10、Technorati
http://www.technorati.com/
雜志、期刊搜索引擎
1、eLibrary
http://ask.elibrary.com/
2、FindArticles.com
http://www.findarticles.com/
3、MagPortal
http://www.magportal.com/
主要購(gòu)物搜索引擎
1、BizRate
http://www.bizrate.com
2、DealTime
http://www.dealtime.com
3、Froogle
http://www.froogle.com
4、Kelkoo
http://www.kelkoo.co.uk/
5、MSN Shopping
http://shopping.msn.com/
6、mySimon
http://www.mysimon.com/
7、NexTag
http://www.nextag.com/
8、PriceGrabber.com
http://www.pricegrabber.com/
9、Yahoo Shopping
http://shopping.yahoo.com/
其它購(gòu)物搜索引擎
1、Buyer’s Index
http://www.buyersindex.com/
2、Dulance
http://www.dulance.com/
3、ePublicEye.com
http://www.epubliceye.com
4、PriceScan
http://www.pricescan.com/
專業(yè)搜索引擎
1、AddAll
http://www.addall.com/
2、CatalogCity.com
http://www.catalogcity.com/
3、Google Catalogs
http://catalogs.google.com/
4、Images/Audio/Video
5、AllTheWeb
http://www.alltheweb.com/
6、AltaVista
http://www.altavista.com/
7、Ditto(images only)
http://www.ditto.com/
8、Google Images (images only)
http://images.google.com
9、Kazaa Media Desktop (MP3 only)
http://www.kazaa.com/
10、Lycos Pictures and Sounds
http://multimedia.lycos.com/
11、MIDI Explorer (MIDI sound files only)
http://www.musicrobot.com/
12、The Music Finder (artists & songs, not files)
http://www.music-finder.net/
13、Picsearch (images only)
http://www.picsearch.com/
14、Singingfish (audio/video only)
http://www.singingfish.com/
Radio & TV Programs
15、SpeechBot
http://speechbot.research.compaq.com/
16、PublicRadioFan.Com
http://www.publicradiofan.com/
17、Radio-Locator
http://www.radio-locator.com/
18、TheFeedRoom
http://www.feedroom.com/
兒童搜索引擎
Ask Jeeves For Kids
http://www.ajkids.com/
Ask Jeeves For Kids
http://www.ajkids.com/
KidsClick!
http://www.kidsclick.org/
Yahooligans
http://www.yahooligans.com/
其它兒童搜索引擎及目錄
1、Awesome Library
http://www.awesomelibrary.org/
2、Diddabdoo
http://www.dibdabdoo.com/
3、Education World
http://www.education-world.com/
4、Fact Monster
http://www.factmonster.com/
5、Family Source
http://www.family-source.com/
6、Kids Search Tools
http://www.rcls.org/ksearch.htm
7、SearchEdu.com
http://www.searchedu.com/
8、Teach-nology.com
http://www.teach-nology.com/
9、TekMom’s Search Tools for Students
http://www.tekmom.com/search/
主要搜索工具欄
Ask Jeeves For Kids
http://www.ajkids.com/
Ask Jeeves For Kids
http://www.ajkids.com/
KidsClick!
http://www.kidsclick.org/
Yahooligans
http://www.yahooligans.com/
其它兒童搜索引擎及目錄
Awesome Library
http://www.awesomelibrary.org/
Diddabdoo
http://www.dibdabdoo.com/
Education World
http://www.education-world.com/
Fact Monster
http://www.factmonster.com/
Family Source
http://www.family-source.com/
Kids Search Tools
http://www.rcls.org/ksearch.htm
搜索技巧
在類別中搜索
許多搜索引擎(如Yahoo)都顯示類別,如計(jì)算機(jī)和Internet、商業(yè)和經(jīng)濟(jì)。如果您單擊其中一個(gè)類別,然后再使用搜索引擎,您將可以選擇搜索整個(gè)Internet還是搜索當(dāng)前類別。顯然,在一個(gè)特定類別下進(jìn)行搜索所耗費(fèi)的時(shí)間較少,而且能夠避免大量無(wú)關(guān)的Web站點(diǎn)。
當(dāng)然,您或許還想搜索整個(gè)Internet,以搜索特定類別之外的信息。
使用具體的關(guān)鍵字
如果想要搜索以鳥(niǎo)為主題的Web站點(diǎn),您可以在搜索引擎中輸入關(guān)鍵字“bird”。但是,搜索引擎會(huì)因此返回大量無(wú)關(guān)信息,如談?wù)摳郀柗虻摹靶▲B(niǎo)球(birdie)”或烹飪game
birds不同方法的Web站點(diǎn)。為了避免這種問(wèn)題的出現(xiàn),請(qǐng)使用更為具體的關(guān)鍵字,如“ornithology”(鳥(niǎo)類學(xué),動(dòng)物學(xué)的一個(gè)分支)。您所提供的關(guān)鍵字越具體,搜索引擎返回?zé)o關(guān)Web站點(diǎn)的可能性就越小。
使用多個(gè)關(guān)鍵字
您還可以通過(guò)使用多個(gè)關(guān)鍵字來(lái)縮小搜索范圍。例如,如果想要搜索有關(guān)佛羅里達(dá)州邁阿密市的信息,則輸入兩個(gè)關(guān)鍵字“Miami”和“Florida”。如果只輸入其中一個(gè)關(guān)鍵字,搜索引擎就會(huì)返回諸如Miami
Dolphins足球隊(duì)或Florida Marlins棒球隊(duì)的無(wú)關(guān)信息。一般而言,您提供的關(guān)鍵字越多,搜索引擎返回的結(jié)果越精確。
使用布爾運(yùn)算符
許多搜索引擎都允許在搜索中使用兩個(gè)不同的布爾運(yùn)算符:AND和OR。
如果您想搜索所有同時(shí)包含單詞“hot”和“dog”的Web站點(diǎn),只需要在搜索引擎中輸入如下關(guān)鍵字:
hot AND dog
搜索將返回以熱狗(hot dog)為主題的Web站點(diǎn),但還會(huì)返回一些奇怪的結(jié)果,如談?wù)撊绾卧谝粋(gè)熱天(hot
day)讓一只狗(dog)涼快下來(lái)的Web站點(diǎn)。
如果想要搜索所有包含單詞“hot”或單詞“dog”的Web站點(diǎn),您只需要輸入下面的關(guān)鍵字:
hot OR dog
搜索會(huì)返回與這兩個(gè)單詞有關(guān)的Web站點(diǎn),這些Web站點(diǎn)的主題可能是熱狗(hot
dog)、狗,也可能是不同的空調(diào)在熱天(hot day)使您涼爽、辣醬(hot chilli sauces)或狗糧等。
留意搜索引擎返回的結(jié)果
搜索引擎返回的Web站點(diǎn)順序可能會(huì)影響人們的訪問(wèn),所以,為了增加Web站點(diǎn)的點(diǎn)擊率,一些Web站點(diǎn)會(huì)付費(fèi)給搜索引擎,以在相關(guān)Web站點(diǎn)列表中顯示在靠前的位置。好的搜索引擎會(huì)鑒別Web站點(diǎn)的內(nèi)容,并據(jù)此安排它們的順序,但其他搜索引擎大概不會(huì)這么做。
此外,因?yàn)樗阉饕娼?jīng)常對(duì)最為常用的關(guān)鍵字進(jìn)行搜索,所以許多Web站點(diǎn)在自己的網(wǎng)頁(yè)中隱藏了同一關(guān)鍵字的多個(gè)副本。這使得搜索引擎不再去查找Internet,以返回與關(guān)鍵字有關(guān)的更多信息。
正如讀報(bào)紙、聽(tīng)收音機(jī)或看電視新聞一樣,請(qǐng)留意您所獲得的信息的來(lái)源。搜索引擎能夠幫您找到信息,但無(wú)法驗(yàn)證信息的可靠性。因?yàn)槿魏稳硕伎梢栽诰W(wǎng)上發(fā)布信息。
搜索引擎怎樣判斷網(wǎng)頁(yè)所使用的語(yǔ)言?
人們喜歡以他們所知道的語(yǔ)言列出的搜索結(jié)果,這對(duì)搜索營(yíng)銷人員是十分重要的。當(dāng)一個(gè)搜索者輸入上面圖中的搜索請(qǐng)求時(shí),只有用中文寫的網(wǎng)頁(yè)將被顯示在搜索結(jié)果里面。
在有些國(guó)家,例如日本和中國(guó),大部分搜索者想要結(jié)果限制在母語(yǔ)上。但是在其他地方例如瑞典,搜索可以采用瑞典語(yǔ)和英語(yǔ)來(lái)進(jìn)行。不同國(guó)家的搜索者有不同的語(yǔ)言偏好。
對(duì)搜索營(yíng)銷人員而言,重要的是搜索引擎知道網(wǎng)頁(yè)所使用的語(yǔ)言,如果網(wǎng)頁(yè)沒(méi)能被正確地識(shí)別,可能就會(huì)從本應(yīng)發(fā)現(xiàn)它的搜索者面前消失,從而降低你的引薦訪問(wèn)。
那么搜索引擎是怎樣判斷網(wǎng)頁(yè)所使用的語(yǔ)言呢?這里有很多不同的方法:
1、 語(yǔ)言meta標(biāo)簽
很多網(wǎng)頁(yè)通過(guò)一個(gè)HTML標(biāo)簽來(lái)表明網(wǎng)頁(yè)使用的語(yǔ)言,例如<META http-equiv=”content-language”
content="ja">
表示使用的是日語(yǔ),看起來(lái)簡(jiǎn)單,搜索蜘蛛程序讀取標(biāo)簽,于是搜索引擎知道是什么語(yǔ)言了。但是相對(duì)多的語(yǔ)言meta標(biāo)簽是完全錯(cuò)誤的,沒(méi)有標(biāo)簽,句法錯(cuò)誤,以及語(yǔ)言編碼錯(cuò)誤等等。搜索引擎確實(shí)查看這些標(biāo)簽,但是它們很少只從這些標(biāo)簽來(lái)判定網(wǎng)頁(yè)的語(yǔ)言。
2、字符編碼
計(jì)算機(jī)文件(包括HTML網(wǎng)頁(yè))需要“對(duì)譯本(Key)”正確翻譯文件中的字符(字母,數(shù)字等等)。這種對(duì)譯本被稱為字符編碼。由網(wǎng)頁(yè)中meta標(biāo)簽里聲明,例如<META
http-equiv=content-type content="text/html; charset=GBK">。
網(wǎng)站瀏覽器和搜索蜘蛛程序假定網(wǎng)頁(yè)按照西方語(yǔ)言編碼,因此使用這些語(yǔ)言寫的網(wǎng)頁(yè)不需要這個(gè)標(biāo)簽。為了瀏覽器顯示正確,亞洲、阿拉伯和古代斯拉夫語(yǔ)的文本確實(shí)需要這個(gè)標(biāo)簽。因此,當(dāng)搜索引擎看到針對(duì)這些語(yǔ)言的表情,它對(duì)正確顯示網(wǎng)頁(yè)的語(yǔ)言有了很高的保證。
3、內(nèi)容分析
搜索引擎通過(guò)研究?jī)?nèi)容中的字符模式來(lái)最終判定網(wǎng)頁(yè)的語(yǔ)言,哪怕是短到只有兩句話的網(wǎng)頁(yè),內(nèi)容分析的精確度也非常高。Meta標(biāo)簽只有在內(nèi)容分析后還不確定的情況下才被使用。
多數(shù)情況下,搜索引擎會(huì)自行正確地判斷網(wǎng)頁(yè)的內(nèi)容,對(duì)于只有很少幾個(gè)詞的網(wǎng)頁(yè),要保證網(wǎng)頁(yè)被正確識(shí)別,正確的編碼語(yǔ)言和meta語(yǔ)言標(biāo)簽很重要。
搜索引擎的技術(shù)發(fā)展趨勢(shì)
搜索引擎經(jīng)過(guò)幾年的發(fā)展和摸索,越來(lái)越貼近人們的需求,搜索引擎的技術(shù)也得到了很大的發(fā)展。搜索引擎的最新技術(shù)發(fā)展包括以下幾個(gè)方面:
一、提高搜索引擎對(duì)用戶檢索提問(wèn)的理解
為了提高搜索引擎對(duì)用戶檢索提問(wèn)的理解,就必須有一個(gè)好的檢索提問(wèn)語(yǔ)言,為了克服關(guān)鍵詞檢索和目錄查詢的缺點(diǎn),現(xiàn)在已經(jīng)出現(xiàn)了自然語(yǔ)言智能答詢。用戶可以輸入簡(jiǎn)單的疑問(wèn)句,比如“how
can kill virus of
computer?”。搜索引擎在對(duì)提問(wèn)進(jìn)行結(jié)構(gòu)和內(nèi)容的分析之后,或直接給出提問(wèn)的答案,或引導(dǎo)用戶從幾個(gè)可選擇的問(wèn)題中進(jìn)行再選擇。自然語(yǔ)言的優(yōu)勢(shì)在于,一是使網(wǎng)絡(luò)交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來(lái)講,如果用關(guān)鍵詞查詢,多半人會(huì)用“virus”這個(gè)詞來(lái)檢索,結(jié)果中必然會(huì)包括各類病毒的介紹、病毒是怎樣產(chǎn)生的等等許多無(wú)效信息,而用“how
can kill virus of computer?”,搜索引擎會(huì)將怎樣殺病毒的信息提供給用戶,提高了檢索效率。
二、對(duì)檢索結(jié)果進(jìn)行處理
1、基于鏈接評(píng)價(jià)的搜索引擎
基于鏈接評(píng)價(jià)的搜索引擎的優(yōu)秀代表是Google(http://www.google.com),它獨(dú)創(chuàng)的“鏈接評(píng)價(jià)體系”是基于這樣一種認(rèn)識(shí),一個(gè)網(wǎng)頁(yè)的重要性取決于它被其它網(wǎng)頁(yè)鏈接的數(shù)量,特別是一些已經(jīng)被認(rèn)定是“重要”的網(wǎng)頁(yè)的鏈接數(shù)量。這種評(píng)價(jià)體制與《科技引文索引》的思路非常相似,但是由于互聯(lián)網(wǎng)是在一個(gè)商業(yè)化的環(huán)境中發(fā)展起來(lái)的,一個(gè)網(wǎng)站的被鏈接數(shù)量還與它的商業(yè)推廣有著密切的聯(lián)系,因此這種評(píng)價(jià)體制在某種程度上缺乏客觀性。
2、基于訪問(wèn)大眾性的搜索引擎
基于訪問(wèn)大眾性的搜索引擎的代表是direct
hit,它的基本理念是多數(shù)人選擇訪問(wèn)的網(wǎng)站就是最重要的網(wǎng)站。根據(jù)以前成千上萬(wàn)的網(wǎng)絡(luò)用戶在檢索結(jié)果中實(shí)際所挑選并訪問(wèn)的網(wǎng)站和他們?cè)谶@些網(wǎng)站上花費(fèi)的時(shí)間來(lái)統(tǒng)計(jì)確定有關(guān)網(wǎng)站的重要性排名,并以此來(lái)確定哪些網(wǎng)站最符合用戶的檢索要求。因此具有典型的趨眾性特點(diǎn)。這種評(píng)價(jià)體制與基于鏈接評(píng)價(jià)的搜索引擎有著同樣的缺點(diǎn)。
3、去掉檢索結(jié)果中附加的多余信息
有調(diào)查指出,過(guò)多的附加信息加重了用戶的信息負(fù)擔(dān),為了去掉這些過(guò)多的附加信息,可以采用用戶定制、內(nèi)容過(guò)濾等檢索技術(shù)。
三、確定搜索引擎信息搜集范圍,提高搜索引擎的針對(duì)性
1、垂直主題搜索引擎
網(wǎng)上的信息浩如煙海,網(wǎng)絡(luò)資源以十倍速的增長(zhǎng),一個(gè)搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各主題都做得精確而又專業(yè),使得檢索結(jié)果垃圾太多。這樣以來(lái),垂直主題的搜索引擎以其高度的目標(biāo)化和專業(yè)化在各類搜索引擎中占據(jù)了一系席之地,比如象股票、天氣、新聞等類的搜索引擎,具有很高的針對(duì)性,用戶對(duì)查詢結(jié)果的滿意度較高。作者認(rèn)為,垂直主題有著極大的發(fā)展空間。
2、非www信息的搜索
提供FTP等類信息的檢索
3、多媒體搜索引擎
多媒體檢索主要包括聲音、圖像、視頻的檢索。關(guān)于圖片搜索引擎的原理,《淺談圖片搜索引擎的實(shí)現(xiàn)》http://blog.minidx.com/2007/12/19/265.html
中提出了具有跨時(shí)代意義設(shè)計(jì)思路。
四、將搜索引擎的技術(shù)開(kāi)發(fā)重點(diǎn)放在對(duì)檢索結(jié)果的處理上,提供更優(yōu)化的檢索結(jié)果
1、純凈搜索引擎
這類搜索引擎沒(méi)有自己的信息采集系統(tǒng),利用別人現(xiàn)有的索引數(shù)據(jù)庫(kù),主要關(guān)注檢索的理念、技術(shù)和機(jī)制等。
2、元搜索引擎
現(xiàn)在出現(xiàn)了許多的搜索引擎,其收集信息的范圍、搜索機(jī)制、算法等都不同,用戶不得不去學(xué)習(xí)多個(gè)搜索引擎的用法。每個(gè)搜索引擎平均只能涉及到整個(gè)www資源的30-50%(search
engine
watch數(shù)據(jù)),這樣導(dǎo)致同一個(gè)搜索請(qǐng)求在不同搜索引擎中獲得的查詢結(jié)果的重復(fù)率不足34%,而每一個(gè)搜索引擎的查準(zhǔn)率不到45%。
元搜索引擎(metasearch enging)是將用戶提交的檢索請(qǐng)求到多個(gè)獨(dú)立的搜索引擎上去搜索,并將檢索結(jié)果集中統(tǒng)一處理,以統(tǒng)一的格式提供給用戶,因此有搜索引擎之上的搜索引擎之稱。它的主要精力放在提高搜索速度、智能化處理搜索結(jié)果、個(gè)性搜索功能的設(shè)置和用戶檢索界面的友好性上,查全率和查準(zhǔn)率都比較高。目前比較成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。
3、集成搜索引擎
集成搜索引擎( All-in-One Search Page),亦稱為“多引擎同步檢索系統(tǒng) ”(如百度http://www.baidu.com)是在一個(gè)WWW頁(yè)面上鏈接若干種獨(dú)立的搜索引擎,檢索時(shí)需點(diǎn)選或指定搜索引擎,一次檢索輸入,多引擎同時(shí)搜索,用起來(lái)相當(dāng)方便。
集成搜索引擎無(wú)自建數(shù)據(jù)庫(kù),不需研發(fā)支持技術(shù),當(dāng)然也不能控制和優(yōu)化檢索結(jié)果。但集成搜索引擎制作與維護(hù)技術(shù)簡(jiǎn)單,可隨時(shí)對(duì)所鏈接的搜索引擎進(jìn)行增刪調(diào)整和及時(shí)更新,尤其大規(guī)模專業(yè)(如FLASH、MP3等)搜索引擎集成鏈接,深受特定用戶群歡迎。
4、垂直搜索引擎
垂直搜索引擎是相對(duì)通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來(lái)的新的搜索引擎服務(wù)模式,通過(guò)針對(duì)某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。其特點(diǎn)就是“專、精、深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無(wú)序化,垂直搜索引擎則顯得更加專注、具體和深入。
五、搜索引擎的分類
網(wǎng)頁(yè) 音樂(lè)(翻唱 MP3)影視(電影 電視) 視頻 播客 軟件 BT下載 硬件 圖片 壁紙 相冊(cè) 小說(shuō) 文學(xué) 文檔(論文
述職報(bào)告 思想?yún)R報(bào) 演講稿 入黨申請(qǐng)書 作文 個(gè)人簡(jiǎn)歷 畢業(yè)論文 法律論文 經(jīng)濟(jì)論文 教育論文 會(huì)計(jì)論文 計(jì)算機(jī)論文 畢業(yè)論文集
情書 調(diào)查報(bào)告 求職信 商業(yè)計(jì)劃書 實(shí)習(xí)報(bào)告 就職演說(shuō) 自薦信 企劃方案 企業(yè)管理 年終總結(jié)) 新聞(資訊) 百科(知識(shí) 經(jīng)驗(yàn))
教育 人物 學(xué)校 專業(yè) 論壇 社區(qū) 博客 詞典 翻譯 地圖 動(dòng)漫 Flash 游戲 娛樂(lè) 笑話 汽車 家電 手機(jī) 廣告 購(gòu)物
商業(yè) 黃頁(yè) 房產(chǎn) 招聘 財(cái)經(jīng) 股票 基金 法律 國(guó)學(xué) 圖書 政府 目錄 學(xué)術(shù) 代碼 公交 實(shí)用查詢等幾十個(gè)分類。
六、搜索引擎的最后一步
10年前我們要查閱資料,請(qǐng)教問(wèn)題,更多想到的是請(qǐng)教專家,圖書管查閱等傳統(tǒng)方式。常常為了一個(gè)簡(jiǎn)單的問(wèn)題而到處尋師,在圖書館翻著類似我的電腦桌抽屜里的檢索卡片,苦苦尋找。曾幾何時(shí),互聯(lián)網(wǎng)的普及與興起,搜索引擎的出現(xiàn),逐漸改變著我們的生活習(xí)慣和思維方式。很多問(wèn)題“baidu一下,你就知道。”
就像這里用的“曾幾何時(shí)”這一詞,中文不好的我只有模糊的理解,還以為有“曾經(jīng)”的意思,想用為第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“補(bǔ)官揚(yáng)州,公得謝歸。曾幾何時(shí),訃者來(lái)門。”
才知是才過(guò)了不久的意思。
搜索引擎(search
engine)是一個(gè)系統(tǒng),能從大量信息中找到所需的信息,提供給用戶。互聯(lián)網(wǎng)出現(xiàn)到現(xiàn)今,信息量可以說(shuō)成密指數(shù)的增長(zhǎng),大量信息就像Google的原本含義一樣“1的后面跟著100個(gè)0”,這個(gè)數(shù)比宇宙所有的基本粒子的數(shù)量總和還要大。在這浩如煙海的信息中怎么才能找到自己需要的信息呢?搜索引擎就像一只神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。
事物的發(fā)展往往遵循著合久必分,分久必合的規(guī)律,每一次的合與分都是代表著更高級(jí)更先進(jìn)。同樣搜索引擎從最初的Archie可以用文件名查找整個(gè)互聯(lián)網(wǎng)中FTP文件的系統(tǒng),發(fā)展到Y(jié)ahoo早期一種手工錄入的分行業(yè)的目錄檢索。隨著搜索技術(shù)的發(fā)展,元標(biāo)記搜索、全文搜索重新又把整個(gè)互連網(wǎng)的信息整合起來(lái)提供給用戶,目前的Baidu、Google提供的就是一種整個(gè)互聯(lián)網(wǎng)的全文搜索,這種整合信息的搜索也稱為水平搜索。這種水平全文搜索固然可以把網(wǎng)絡(luò)中的所有相關(guān)信息提供給用,但這種“所有”不代表著是用戶所需的“所有”,往往夾雜著許多垃圾信息。問(wèn)題出現(xiàn)就伴隨著去解決,如果平常使用搜索引擎比較全面,你會(huì)發(fā)現(xiàn)Baidu、Goolge都有了“更多”的選項(xiàng),其中出現(xiàn)了大學(xué)搜索、新聞搜索、圖書搜索、圖片搜索等等這些專業(yè)化,行業(yè)化的搜索,也稱為垂直搜索。當(dāng)前垂直搜索正在逐漸走向豐富化、專業(yè)化、行業(yè)化,將越來(lái)越滿足人們的搜索需求。比如很多人在搜索問(wèn)題時(shí)會(huì)到百度知道里搜索,因?yàn)槟抢锔嗅槍?duì)性;搜索天氣會(huì)到天氣搜索中等等。
那么搜索引擎的下一步發(fā)展是什么呢?讓我們回想一下搜索引擎的定義:一個(gè)系統(tǒng),能從大量信息中找到所需的信息,提供給用戶。根據(jù)技術(shù)的不斷發(fā)展和事物規(guī)律暢想一下,垂直搜索發(fā)展到一定程度會(huì)出現(xiàn)信息的單一專業(yè)化太強(qiáng),整體信息綜合化不好,而人們需要的不但要有專業(yè)信息,同樣也要有整體聯(lián)想信息。隨著人工智能、神經(jīng)網(wǎng)絡(luò)、網(wǎng)格計(jì)算等搜索技術(shù)的發(fā)展,我們又將有一個(gè)能整合互聯(lián)網(wǎng)信息,智能的提供用戶確實(shí)所“需”的信息,而不簡(jiǎn)單只是所“要”的信息,因?yàn)楹芏鄷r(shí)候搜索時(shí),自己都不知道要什么。
再回的現(xiàn)在的搜索引擎,它就像一只神奇的手,從雜亂的信息中抽出一條清晰的檢索路徑。這個(gè)引擎提供給用戶的最后一步是什么?是一條清晰的檢索路徑。好的,注意這是一條檢索路徑,在這條路徑的上的檢索和信息提取是什么呢,是我們的閱讀和大腦的判斷。也就是做搜索引擎的最后一步是我們的大腦。得到的這條路徑清晰但也并不簡(jiǎn)短,需要我們進(jìn)行快速的瀏覽,呵呵,繞來(lái)繞去,得出一個(gè)結(jié)論,快速閱讀也是搜索引擎中的一部分。
隨著搜索市場(chǎng)競(jìng)爭(zhēng)的白熱化,搜索引擎不僅開(kāi)始深挖自己的戰(zhàn)壕,還開(kāi)始打起了口水戰(zhàn),而山寨搜索引擎在高舉著“整合”的大旗,開(kāi)始大搖大擺地進(jìn)入這個(gè)本來(lái)只有巨頭壟斷的市場(chǎng)。國(guó)人充分發(fā)揮著其無(wú)比的想象力,準(zhǔn)備讓國(guó)內(nèi)的互聯(lián)網(wǎng)“步入搜索新時(shí)代”。
下面就讓我們看看什么是山寨搜索引擎
“百google度”- baigoogledu.com
最早的山寨搜索引擎,曾經(jīng)名噪一時(shí)。最早確定了山寨搜索引擎的模式,而且訪問(wèn)量很高,但功能簡(jiǎn)單,而且讓用戶需要不停的兩邊拖拉才能看到完整的結(jié)果。
“百谷虎”- baigoohoo.com
由于某家新聞媒體的報(bào)道,最近聲名大振,高舉著“山寨”大旗,讓國(guó)人開(kāi)始了解什么是山寨搜索引擎,名字極富創(chuàng)意。可惜由于搜索結(jié)果被并排擠在一起,似乎沒(méi)有什么實(shí)際使用價(jià)值。
“山寨文化”在每個(gè)人的心目中可能都有著不同的感覺(jué),但隨著這股風(fēng)越刮越烈,可見(jiàn)草根對(duì)“山寨”的內(nèi)涵還是有相當(dāng)?shù)恼J(rèn)同,百度和谷歌的嘴仗打的不亦熱乎,都指責(zé)對(duì)方結(jié)果不公正,山寨搜索卻硬要把這兩個(gè)冤家放在一起。也許很多人對(duì)“山寨搜索”嗤之以鼻,但是對(duì)于普通網(wǎng)民來(lái)說(shuō),是誰(shuí)的搜索并不重要,是我們需要的結(jié)果才是最重要的么。如果是你,你會(huì)選擇誰(shuí)呢?
搜索引擎優(yōu)化(Search Engine Optimization,簡(jiǎn)稱SEO) 搜索引擎優(yōu)化即Search Engine
Optimization,用英文描述是to use some technics to make your website in
the top places in Search Engine when somebody is using Search
Engine to find
something,翻譯成中文就是“搜索引擎優(yōu)化”,一般可簡(jiǎn)稱為搜索優(yōu)化。與之相關(guān)的搜索知識(shí)還有Search Engine
Marketing(搜索引擎營(yíng)銷),Search Engine Positioning(搜索引擎定位)、Search
Engine Ranking(搜索引擎排名)等。
搜索引擎的未來(lái)展望
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上可以搜尋的網(wǎng)頁(yè)變得愈來(lái)愈多,而網(wǎng)頁(yè)內(nèi)容的質(zhì)素亦變得良莠不齊,沒(méi)有保證。所以,未來(lái)的搜索引擎將會(huì)朝著知識(shí)型搜索引擎的方向發(fā)展,期以為搜尋者提供更準(zhǔn)確及適用的資料。目前,網(wǎng)上的百科全書如雨后春筍般發(fā)展起來(lái);另一方面,近年來(lái)亦有不少公司嘗試在搜尋方面改進(jìn),務(wù)求更符合用戶的要求。當(dāng)中諸如Copernic
Agent之類的搜尋代理就是其中之一。
在臺(tái)灣,威知資訊(WebGenie)是利用文字探勘(Text
Mining)技術(shù)發(fā)展搜尋引擎產(chǎn)品的公司,利用人工智能算法,可達(dá)成目前搜尋引擎所缺乏的簡(jiǎn)易人機(jī)互動(dòng)模式,諸如關(guān)聯(lián)字提示、動(dòng)態(tài)分類字提示等[1],算是較另類的搜尋引擎產(chǎn)品。
搜索引擎的使用方法
搜索關(guān)鍵詞提煉
選擇搜索關(guān)鍵詞的原則是,首先確定你所要達(dá)到的目標(biāo),在腦子里要形成一個(gè)比較清晰概念,即我要找的到底是什么?是資料性的文檔?還是某種產(chǎn)品或服務(wù)?然后再分析這些信息都有些什么共性,以及區(qū)別于其他同類信息的特性,最后從這些方向性的概念中提煉出此類信息最具代表性的關(guān)鍵詞。如果這一步做好了,往往就能迅速的定位你要找的東西,而且多數(shù)時(shí)候你根本不需要用到其他更復(fù)雜的搜索技巧。
細(xì)化搜索條件
你給出的搜索條件越具體,搜索引擎返回的結(jié)果也會(huì)越精確。
比方說(shuō)你想查找有關(guān)電腦冒險(xiǎn)游戲方面的資料,輸入game是無(wú)濟(jì)于事的。computer
game范圍就小一些,當(dāng)然最好是敲入computer adventure game,返回的結(jié)果會(huì)精確得多。
此外一些功能詞匯和太常用的名詞,如對(duì)英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。這些詞被稱為停用詞(Stop
Words)或過(guò)濾詞(Filter Words),在搜索時(shí)這些詞都將被搜索引擎忽略。
用好搜索邏輯命令
搜索引擎基本上都支持附加邏輯命令查詢,常用的是“+”號(hào)和“-”號(hào),或與之相對(duì)應(yīng)的布爾(Boolean)邏輯命令A(yù)ND、OR和NOT。用好這些命令符號(hào)可以大幅提高我們的搜索精度。
精確匹配搜索
除利用前面提到的邏輯命令來(lái)縮小查詢范圍外,還可使用""引號(hào)(注意為英文字符。雖然現(xiàn)在一些搜索引擎已支持中文標(biāo)點(diǎn)符號(hào),但顧及到其他引擎,最好養(yǎng)成使用英文字符的習(xí)慣)來(lái)進(jìn)行精確匹配查詢(也稱短語(yǔ)搜索)。
特殊搜索命令
標(biāo)題搜索
多數(shù)搜索引擎都支持針對(duì)網(wǎng)頁(yè)標(biāo)題的搜索,命令是“title:”,在進(jìn)行標(biāo)題搜索時(shí),前面提到的邏輯符號(hào)和精確匹配原則同樣適用。
網(wǎng)站搜索
此外我們還可以針對(duì)網(wǎng)站進(jìn)行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。
鏈接搜索
在Google和AltaVista中,用戶均可通過(guò)“l(fā)ink:”命令來(lái)查找某網(wǎng)站的外部導(dǎo)入鏈接(inbound
links)。其他一些引擎也有同樣的功能,只不過(guò)命令格式稍有區(qū)別。你可以用這個(gè)命令來(lái)查看是誰(shuí)以及有多少網(wǎng)站與你做了鏈接。
seoer
SEO,中文意思是搜索引擎優(yōu)化。指通過(guò)了解各類搜索引擎如何抓取互聯(lián)網(wǎng)頁(yè)面,如何進(jìn)行索引以及如何確定其對(duì)某一特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行相關(guān)的優(yōu)化,使其提高搜索引擎排名。