據(jù)可靠資料顯示,Google正在著手處理互聯(lián)網(wǎng)上的垃圾信息。
據(jù)Slashdot新聞?wù)搲木W(wǎng)友們稱,從這個(gè)星期開(kāi)始,用Google搜索引擎搜索如speaker bracelet或者candle
truck等古怪的詞組時(shí),獲得的搜索結(jié)果非常少,甚至連一個(gè)期待會(huì)得到的相關(guān)結(jié)果都沒(méi)有。
據(jù)劍橋大學(xué)的計(jì)算機(jī)程序員兼互聯(lián)網(wǎng)信息過(guò)濾系統(tǒng)專家Seth
Finkelstein透露,他已經(jīng)找到原因了。在上周五,F(xiàn)inkelstein稱:“Google搜索引擎的搜索結(jié)果過(guò)于繁多,這很可能是由搜索引擎中有關(guān)垃圾信息過(guò)濾運(yùn)算法的一個(gè)漏洞導(dǎo)致的。”網(wǎng)絡(luò)垃圾信息制造者花費(fèi)了大量的時(shí)間,通過(guò)使用虛假的網(wǎng)頁(yè)或鏈接去增強(qiáng)其垃圾信息的瀏覽量,最終使其網(wǎng)頁(yè)占據(jù)了Google搜索結(jié)果的最前列。有鑒于此,Google的工程師們正想辦法去清除這些垃圾信息,確保用戶得到的是有價(jià)值的搜索結(jié)果。
Finkelstein將其關(guān)于這個(gè)問(wèn)題的理論研究放到了自己的個(gè)人主頁(yè)上(www.sethf.com),該主頁(yè)還包括了一個(gè)明顯地發(fā)布垃圾信息網(wǎng)頁(yè)的鏈接。奇怪的是該網(wǎng)頁(yè)只是一列看似是由非常多的詞組組成的無(wú)序排列(如rugs,
home mortgage loan, 1966 chevrolet corvette),并通過(guò)更多的詞組鏈接到更多的網(wǎng)頁(yè)。
Finkelstein透露,Google搜索引擎的一個(gè)漏洞導(dǎo)致了上述情況的發(fā)生。只要Google找到某些相關(guān)的字眼,它就會(huì)將其“一網(wǎng)打盡”。
Google的發(fā)言人Nathan Tyler承認(rèn),上星期公司已經(jīng)找到了該漏洞,但他拒絕透露更詳細(xì)的情況。
那么,到底是些什么用戶在搜索諸如“speaker bracelets”或“candle truck”這類詞組呢?答案是由那些只在google主頁(yè)(www.googlewhack.com)進(jìn)行搜索的愛(ài)好者們(GoogleWhackers)發(fā)現(xiàn)的。最近,包括fetishized
armadillo和panfish interrogation在內(nèi)的,能在Google搜索到的詞組可能已經(jīng)不少了。
|