中文搜索引擎指南網

 找回密碼
 禁止注冊

QQ登錄

只需一步,快速開始

搜索
查看: 12445|回復: 5
打印 上一主題 下一主題

Google 搜索算法的工作方式

[復制鏈接]
跳轉到指定樓層
1#
發表于 2021-2-19 00:28:32 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
網絡上的信息繁多龐雜,如果不借助一些服務對信息進行整理和排序,要找到您需要的內容會如同大海撈針。

Google 排名系統旨在實現這一目標:它們會對 Google 搜索索引中的數千億個網頁進行整理和排序,以便瞬間找出最相關、最實用的結果,并將這些結果以一種有助于您查找所需內容的方式呈現出來。

這些排名系統由一系列算法組成,而不是一個算法。為了向您提供最實用的信息,Google 搜索算法會考慮很多因素,包括您查詢的字詞、網頁的相關性和可用性、來源的專業度,以及您所在的位置和您采用的設置。系統為每個因素賦予的權重因查詢的性質而異,例如,與字典定義的查詢結果相比,對于時事新聞主題的查詢結果,內容的新鮮度更加重要。

為了協助確保 Google 搜索算法符合嚴苛的相關性和質量標準,Google制定了嚴格的流程,不僅展開現場測試,更有數千位來自世界各地訓練有素的外部 Google 搜索質量評分者參與評估。這些質量評分者會遵循嚴格的指南,該指南明確指出了 Google 搜索算法的目標,可供所有人查看。
分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏
2#
 樓主| 發表于 2021-2-19 00:29:20 | 只看該作者
分析您的字詞

理解搜索字詞的含義對于返回優質結果至關重要。因此,為了找到包含相關信息的頁面,Google 的第一步就是分析您的搜索查詢中的字詞的含義。我們創建了語言模型,試圖了解應該使用關鍵詞的哪些部分在索引中進行查詢。

這會涉及到看起來如同解析拼寫錯誤一樣簡單的步驟,并會擴展到通過將自然語言理解方面的部分最新研究成果付諸應用來嘗試理解您輸入的查詢的類型。例如,即便一個字詞有多種定義,Google 的同義詞系統也能幫助 Google 搜索理解您的意思。該系統的開發過程歷時超 5 年,大幅改善了超過 30% 的搜索的結果(涵蓋各種語言)。

Google還會嘗試理解您要尋找的信息所屬的類別。是非常具體的搜索還是寬泛的查詢?是否存在“審核”、“照片”或“營業時間”等能夠表明搜索所蘊含的具體信息需求的字詞?您是否在搜索暗示您想查找當天所發布內容的熱門關鍵字?或者,您是否在搜索附近的商家并需要獲得相關的本地信息?

對于這種查詢分類,一個非常重要的方面在于,Google會分析您的查詢,以確定您是不是想要獲取新鮮內容。如果您搜索熱門關鍵字,我們的新鮮度算法會將其解讀為這樣一種信號:最新信息可能比日期較早的網頁更有用。也就是說,當您搜索最新的“中國男子籃球職業聯賽比分”、《星光大道》比賽結果或“中石油收益”時,您將會看到最新信息。
回復

使用道具 舉報

3#
 樓主| 發表于 2021-2-19 00:31:14 | 只看該作者
與您的搜索內容相符


接下來,Google會尋找包含與相應查詢匹配的信息的網頁。當您搜索時,在最基本的層面上,我們的算法會在索引中查詢您的搜索關鍵詞以找到適當的網頁。這些算法會分析相關關鍵字在某個網頁上(不論是在標題中還是在正文中)的出現頻率和顯示位置。

當某個網頁中包含與您的搜索查詢內容相同的關鍵字時,這是表示搜索到的信息可能與您要查找的內容相關的最基本信號。如果網頁或者文本的標題或正文中出現這些關鍵字,則表示該信息與您要查找的內容相關的可能性更大了。除了簡單的關鍵字匹配之外,Google還使用經過匯總和匿名化處理的互動數據來評估搜索結果是否與查詢內容相關。Google會將這些數據轉換為信號,以協助我們的機器學習系統更好地評估相關性。


除了匹配關鍵字,Google的算法還會尋找線索來衡量潛在搜索結果能從多大程度上滿足用戶的搜索需求。當您搜索“狗”時,您想看到的應該不是含有數百個“狗”字的網頁。Google會盡力確定網頁是否包含與您的查詢對應的答案(而非只是重復您的查詢)。因此,Google 搜索算法會分析網頁是否包含相關內容,例如狗的圖片、視頻,甚至是品種列表。最后,Google會檢查網頁所用的語言是否與您的查詢所用的語言相同,以便優先顯示采用您的首選語言的網頁。

需要說明的是,盡管Google的系統確實會通過尋找這類可量化的信號來評估相關性,但并不會因此用于分析主觀觀念,例如分析網頁內容的觀點或政治傾向。

回復

使用道具 舉報

4#
 樓主| 發表于 2021-2-19 00:32:03 | 只看該作者
為實用網頁排名

對于一項典型的查詢,含有可能相關的信息的網頁會多達數千個甚至數百萬個。因此,為了幫助將最符合需求的網頁排在靠前的位置,Google還編寫了算法來評估這些網頁的實用性。

這些算法會分析數百種不同的因素 - 從內容的新鮮度,到您的搜索關鍵詞的出現次數以及網頁能否提供出色的用戶體驗 - 以盡力呈現網絡所能提供的最有用的信息。為了評估內容在相關主題方面的可信度和權威性,我們會尋找那些看起來在類似查詢中受到大量用戶青睞的網站。如果與該主題相關的其他知名網站鏈接到了相應頁面,則可充分說明此頁面上的信息具有較高的品質。

網絡中有很多垃圾網站會試圖通過再三重復關鍵字或購買可提升 PageRank 的鏈接等各種不當手段,蒙混到搜索結果中靠前的位置。這些網站提供的用戶體驗非常糟糕,甚至可能會傷害或誤導 Google 用戶。因此,我們編寫了算法來識別網絡垃圾并將那些違反 Google 網站站長指南的網站從結果中移除。

網絡和更廣闊信息生態系統中的內容在不斷變化,因此Google不會停止衡量和評估自身系統的質量,確保在信息相關性和權威性之間實現適當的平衡,讓用戶始終信任看到的搜索結果。
回復

使用道具 舉報

5#
 樓主| 發表于 2021-2-19 00:32:46 | 只看該作者
返回最佳結果

在為您提供結果之前,Google 會評估所有相關信息的綜合效果:這些搜索結果是只有一個主題,還是有很多主題?是否有過多的頁面在著重探討一條狹義的詮釋?Google 會努力根據您的搜索類型以最有用的格式提供一系列多樣的信息。此外,隨著網絡不斷發展,我們會不斷優化排名系統,以便為更多查詢提供更優質的結果。

這些算法會通過分析相關信號來評估是否所有用戶都能查看搜索結果。例如:網站是否能在不同的瀏覽器中正常顯示;網站是否適合各種類型和尺寸的設備(包括桌面設備、平板電腦和智能手機);以及網頁加載時間對于互聯網連接速度較慢的用戶而言是否合適。

鑒于網站所有者可以提高其網站的易用性,Google 會在對 Google 搜索算法做出重大更改時盡量提前通知網站所有者以便其可以做出應對。例如,在 2018 年 1 月,Google 宣布 Google 搜索算法將開始把網站的“網頁速度”納入考量范圍,這一通知比更改的正式實施時間提早了 6 個月。為協助網站所有者,我們提供了詳細的指導以及 PageSpeed Insights 和 Webpagetest.org等工具,這樣網站所有者就可以了解他們需要調整哪些方面(如果有)來使其網站更適合移動設備。

您可以在此處詳細了解 Google 為網站所有者提供的工具和提示。
回復

使用道具 舉報

6#
 樓主| 發表于 2021-2-19 00:33:39 | 只看該作者
考慮具體環境

您的位置、過往搜索記錄和搜索設置等信息可幫助我們即時地為您量身顯示最實用且最相關的結果。

Google使用您的國家/地區和位置信息來提供與您所在區域相關的內容。例如,如果您身處芝加哥并搜索“橄欖球”,Google 便極有可能會先為您顯示有關美國橄欖球和芝加哥熊隊的結果。但如果您是在倫敦搜索“足球”,Google 則會在比較靠前的位置顯示有關英式足球和英超聯賽的結果。搜索設置也是一項重要的指標,可表明哪些結果可能會對您有用。例如,如果您設置了首選語言或已選擇啟用安全搜索(一種有助于濾除露骨結果的工具)。

在某些情況下,Google可能還會使用您的近期搜索活動的相關信息為您提供個性化的結果。例如,如果您搜索“巴塞羅那”,而且您最近搜索過“巴塞羅那 vs 阿森納”,系統便可能會將您的這條搜索記錄視為一個重要線索,從而推斷出您十有八九是想查找與足球俱樂部(而非城市)相關的信息。您可通過訪問 myaccount.google.com 來控制系統可使用哪些搜索活動來提升您的搜索體驗,包括調整哪些數據會保存到您的 Google 帳號。

Google 搜索還有其他一些功能也有助于根據您 Google 帳號中的搜索活動記錄為您顯示個性化的搜索結果。例如,如果您搜索“附近的活動”,Google 可能會專門向您推薦我們認為您可能感興趣的那些類活動。這些系統旨在協助 Google 搜索提供與您的興趣相符的信息,而不會推斷敏感性特征,例如您的種族、宗教或黨派。

您可以在myaccount.google.com上控制系統為提升您的搜索體驗可使用的搜索活動信息,包括設置系統可將哪些數據保存到您的 Google 帳號中。要停用 Google 搜索根據您帳號中的活動記錄提供個性化結果的功能,請關閉“網絡與應用活動記錄”。
回復

使用道具 舉報

Archiver|手機版|小黑屋|教你搜 ( 魯ICP備16006309號

GMT+8, 2025-3-15 05:09 , Processed in 2.778733 second(s), 19 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表