中文搜索引擎指南網

 

首頁

首頁>>搜索新動態>>正文

人物專訪:搜索技術人生

 09:40 新浪科技

2003年03月16日  閆輝 《程序員》雜志


  李彥宏:百度公司總裁

  關鍵詞:硅谷、搜索引擎

  記者:您剛從硅谷回到北京,能向我們的讀者簡單介紹一下情況嗎?記得您寫過一本《硅谷商戰》的書,最近有沒有再寫續篇的打算?

  李彥宏:硅谷現在的高科技產業還是非常不景氣,大部分公司仍在不斷收縮。我的很多朋友也賦閑家中,這在以前是不可想象的。

  不過IT市場中也有亮點,這就是投資界對搜索領域持有濃厚興趣,并對搜索領域可能出現的各種情況進行預測。像摩根斯坦利這種大型的投資銀行對搜索領域中也很了解,哪怕只是一個非常小的公司也都了解。

  談到《硅谷商戰》,我當時是采用章回小說的方式講述發生在硅谷的一些故事。現在還有朋友讓我寫續集,講講近些年硅谷發生的事件,肯定更具故事性。不過自己做公司太緊張,沒有時間寫。

  記者:從你了解的情況,現在硅谷對技術型公司的重視程度如何?技術創意還如以前那樣層出不窮嗎?

  李彥宏:應該說,如果只是泛泛的技術創新,很難引起投資商的興趣。

  但搜索領域比較特殊。2002年年12月份,華爾街的一位著名股票分析師Mary Meeker寫了一份報告。其中,他認為Internet作為一種現象,本質可以用三個單詞來表示:Search、Find、Obtain,也就是搜索、發現、獲得。他像ebay、yahoo這樣成功的公司全都是充分利用了這三種本質。據說,ebay現在正在測試新的用戶界面,特點就是首頁的主要部分只有一個大的搜索框。

  記者:從事搜索引擎技術研究的公司層出不窮,搜索引擎的發展也經歷了很多階段。您認為搜索引擎發展有哪些里程碑?

  李彥宏:我認為有三個里程碑:在1993年左右,大家感覺網上的信息很多,需要搜索,但當時對搜索技術的了解很少,于是就把研究領域中的信息檢索技術照搬過來做了搜索引擎。因此第一代搜索引擎就是按照學術界資料檢索技術,而沒有考慮到互聯網的網狀特性和超文本。

  我在1996年開始意識這樣一點,互聯網和以前信息檢索最大的差別在于互聯網上的信息是有指向的。檢索的時候,把這個屬性考慮進去,才能給大家提供更相關的結果,這就是“超鏈分析”。采用這種技術后,搜索引擎的發展出現了巨大飛躍。像google宣稱的pagerank就是基于這種想法的,到2000年,主流搜索引擎都已經采用了這種技術。

  第三就是競價排名,雖然有人認為這樣做太商業化,但實際上這時搜索引擎的發展已經超越了技術層面,屬于思路變化的范疇了。檢索結果前的sponsor鏈接都是和檢索結果有一定關聯的,而且這些內容本身對用戶也有商業價值,同時讓企業能夠更直觀的參與檢索結果。

  實際上,搜索引擎不是單獨某項技術,本質上它是一種軟件服務。一個好的搜索引擎是需要經過多年積累才能完善的,完善的服務才能被稱為擁有完善的技術。既然是服務,就要求在細節上精雕細刻。具體講,“超鏈分析”、競價排名的技術難度并不足以產生壁壘。

  在技術上,很多優秀的程序員喜歡攻克一個難關來證明自己,而忽略實現過程中有可能引起系統崩潰的細節。很多人認為模仿一個優秀的產品,只要做出對方具有的功能就可以。事實上,作為服務,必須讓用戶感覺可依賴,這才是在工業界做出一個受歡迎產品的要求。

  記者:軟件服務也是軟件產品發展的趨勢。您是如何意識到在商業運作中,軟件技術應該以用戶需求為導向的呢?在思想上有沒有經歷過一些轉變?

  李彥宏:的確是我的一些經歷讓我產生了這種轉變。我在1997年夏天加入Infoseek之后,當時全世界范圍內,也只有硅谷幾家真正的互聯網公司。在這里,我能夠切身體會到技術作為一項服務給人們帶來的影響。

  普通用戶就是用一個簡單的搜索框檢索內容的,他并不關心背后的技術。當時,我們每天除了編程外,還會經常察看后臺流量的變化,一旦服務出現不穩定情況,天花板上的警戒燈就會閃爍,這時所有的程序員就會很緊張,知道自己的軟件在提供服務時產生了問題。不斷加強軟件服務意識,這是我在Infoseek得到的很大收獲。

  去年下半年我有四五個月參與了很多,我們做了一個閃電計劃。當時項目時間也很緊張,但我指出這次計劃成功與否的衡量指標不是技術指標,而是用戶訪問的pageview。開始,大家都覺得自己只是一個程序員,怎么能夠左右pageview呢!我堅持這樣的理念:只要做的技術足夠好,方便用戶,那就會有人喜歡。年底的時候,事實也證明了這一點。

  對搜索引擎,我能夠站在用戶的角度使用,同時我也站在程序員的角度知道其內部是如何實現的,所以我能迅速指出缺乏的關鍵之處,而沒有這種工作經歷的技術人員可能不太重視。

  記者:第一代搜索引擎現在存活下來的很少了,主要原因是什么?大家在使用搜索引擎時都傾向于使用更多種類的搜索引擎,如何體現出其中的差別化?

  李彥宏:很多搜索引擎公司倒掉,這說明搜索引擎技術發展的很快,只要下一代的技術做的好就會很快取代前一代。不過,搜索技術成就了很多公司的輝煌,參與的人員也都得到了相應的回報。

  從用戶體驗看,使用方法非常類似,不大可能構筑使用障礙,轉換搜索引擎的幾乎是不需要代價的。因此,好的技術很容易吸引用戶轉向自己。同時搜索引擎是免費的,不可能像其他產品通過降價或者某種商業運作方式來爭奪市場。

  記者:那搜索引擎的行業壁壘主要表現在哪里呢?

  李彥宏:實際上,簡單的搜索并不難實現,一條grep語句就可以實現某些簡單的搜索,但創建一個成熟、受歡迎的商業化搜索引擎,其難度是很高的。

  評價搜索引擎的優劣有四個指標:收集的有效網頁數量,這本身就需要很高的技術。因為盡管小的數據庫中也可以找到需要的資料,但用戶總有一種用更大的數據庫的傾向;
第二是更新率:要快速更新信息,就需要提高程序設計的效率。Spider的效率直接影響數據庫內容的更新速度。

  第三是搜索速度:同樣需要軟件設計上重視效率;第四就是相關性:把更滿足用戶需求的結果放在前面,這是需要綜合很多因素進行計算的。

  記者:搜索引擎技術在全球的競爭如何?

  李彥宏:搜索引擎技術是相通的,因此不同語言的版本推廣上相對容易一些。因此我們一直在說,如果百度能夠和google在中國對抗的話,那在任何一個國家都可以的。

  我們還準備推出日文和韓文版,其實全球日文信息量可能比中文還要大。但在日本就沒有一家搜索引擎公司。前一段時間,我們接待了日本的一位政府調研人士,調研的題目是為什么在中國韓國有很多小的高科技公司,但日本很少,后來發現日本在IT領域中嚴重依賴于美國技術,而且很多地方都傾向于大型公司,而不喜歡去創業。

  關鍵詞:程序員

  記者:現在百度技術團隊構成怎樣?

  李彥宏:百度是一個技術型公司,開發團隊包括四十多名軟件工程師,主要做Spider和Search的開發,還有測試、技術支持以及大客戶支持工程師。現在團隊已經形成了比較好的管理梯隊。軟件服務涉及到很多細節,所以我們不是靠某一個程序員的天才,而是靠一批對行業了解、足夠聰明、并合作的程序員。

  公司創始時,我的確有擔心國內的技術實力同國外差距很大,所以還特意在硅谷設立了辦公室來招人,準備兩邊協同工作。后來發現國內的技術人員非常優秀,完全可以做出來世界級的產品。

  記者:開發團隊從幾個人發展到現在數十人,是否在開發管理上經歷過曲折?

  李彥宏:的確如此,在推出最早的版本之后,我的精力就放在宣稱推廣等商務活動上了,技術上依賴帶起來的技術團隊。后來,技術團隊膨脹的太快,在技術管理上出現了一些危機,主要表現在公司逐漸壯大的過程中,很多人對自己的位置定位不是很準。一些好的技術人員對技術關注越來越少,而對管理產生了興趣,并對未來的發展產生了迷茫。于是借助去年實施的“閃電計劃”,我又重新回到開發中,帶領一個新技術團隊。

  硅谷的一些經歷能讓我告訴程序員應該重視的是什么,對于角色轉換應該有什么樣的期望值。我告訴他們,我看到的成功硅谷創業型公司有什么共同之處。我認為,作為一個好程序員或者令人放心程序員的標準不僅要能夠解決問題,而且做出來的產品是可信賴的。

  閃電計劃完成后,除了完成當初設定的技術指標和商業指標外,更大的成就就是又帶起了一個好的技術團隊,他們之間的合作現在已經非常默契。

  記者:您在招聘時,感覺國內的程序員和硅谷有什么差別?

  李彥宏:我們一般沿襲硅谷招聘的做法,考察程序員時,除了個人技術能力之外,最看中的是他對公司文化是否認可。如果這個人只考慮找一份工作而已,那他就很難和其他人合作,沒有團隊合作的精神,就很難認同公司的文化,融入公司的環境。

  但同硅谷有差距的是,國內的程序員在工業界、商業化環境下工作經歷不夠。因為中國真正做技術的公司太少了,大部分都是系統集成公司,在這些公司中,對軟件的基礎知識已經很少用到。所以我們招收比較多的是剛畢業的學生,這些人雖然沒有工作經驗,但基礎知識還掌握的比較牢固。因為我們更看中有培養空間的人,看中他們的潛力。而在硅谷,只有大公司才招畢業生,一方面是為了充實新生力量,同時也是為了公司形象考慮。即便在公司很困難的時候,一邊裁員,一邊還要招人。

  在美國,很多公司認為只有具備了高技術門檻,才能保證公司迅速成長,因此他們是真正在做研發,程序員也真正地在做產品。而國內很多公司就是技術支持或者系統集成商,程序員做的技術很少用到學校的知識,也不需要考慮效率和算法,所以也很難得到鍛煉。而在美國工業界,學校學到的知識能夠真正應用起來,同時還要了解實現時需要什么樣的技巧。

  關鍵詞:搜索人生

  記者:談談你個人發展的經歷?

  李彥宏:我是1991年到美國準備讀博士的,因為只有讀博士才有獎學金。但到二年級下半年的時候,我越來越認同工業界的做法,因為我去松下做過一段時間的實習,讓我了解到工業界更關注是否適合用戶的使用,是否能夠得到大規模的推廣。而我的理想也是為了影響更多的人,讓更多的人從中受益,所以得到碩士學位后就離開了。

  首先我進入了華爾街日報集團,當時道瓊斯準備做網絡版媒體,其中包括金融方面的集成信息檢索系統,當時采用C和在Sun的服務器和unix環境下做了三年半的開發,當時的工作環境很自由,我也很喜歡。

  但隨著互聯網的迅猛發展,華爾街作為一個媒體更重視編輯記者,并沒有把技術的價值提升到一定的高度。尤其是我認為“超鏈分析”可能會改變整個產業的發展后,發現公司無法提供這方面的發展機會。

  1997年,我加入Infoseek,當時這個公司在硅谷的口碑很好,而且很多同事對搜索引擎的開發經驗和獨特見解令人羨慕,在那個時候,盡管硅谷有成千上萬的小公司,但像Infoseek這樣真正的互聯網公司還很少。

  不過后來Infoseek被迪斯尼收購并開始創建GO網站,但迪斯尼作為一家成功的傳統企業并不了解互聯網,不了解硅谷,不了解網絡重新創建一個品牌很難。很可惜,從那時起,Infoseek開始忽略技術,而一味去強調和傳統媒體的結合,策略已經發生了轉變,開始走下坡路了。

  在互聯網上,很多事情不是錢能夠砸出來的,時機已經過去。總之,Infoseek作為一個互聯網公司是失敗的,沒有能夠和yahoo繼續競爭下去。

  記者:我看到你是“超鏈分析”專利的發明人,當時是怎樣的一種情況呢?

  李彥宏:在美國,有專業的專利律師。但當時這個專利是我的職務發明,所以發明人是我,擁有者屬于我任職的公司,而公司又不懂這個東西的重要性,也不愿意去冒風險打官司。

  記者:在軟件技術專利保護上,美國能保護到什么樣的層次呢?

  李彥宏:算法是可以受保護的,最著名的就是LZW的算法,先做幾乎用到的程序都要向專利所有人付費,還有adobe公司的pdf, jpeg文件格式等都要向unysis公司的專利付費。當然,擁有這種專利的公司規模一般也很大,不會只依賴于專利費生存。但總體上看,在國外的軟件專利保護機制下,大家比較習慣去付費的。
 

 

相關:

Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南網 
版權所有