中文搜索引擎指南網

 找回密碼
 禁止注冊

QQ登錄

只需一步,快速開始

搜索
查看: 10880|回復: 0
打印 上一主題 下一主題

Google 搜索如何整理信息

[復制鏈接]
跳轉到指定樓層
1#
發表于 2021-2-19 00:26:59 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
在您搜索之前,網頁抓取工具會從數千億個網頁中收集信息,然后在 Google 搜索索引中進行整理。

Google 搜索基礎知識

抓取流程是從以往所抓取內容的網址列表和由網站所有者提供的站點地圖開始的。在訪問這些網站時,Google 的抓取工具會使用網站上的鏈接來探索其他網頁。該軟件會特別關注新網站、對現有網站進行的更改以及無效鏈接。計算機程序會確定要抓取的網站、抓取頻率以及要從每個網站中抓取的網頁數量。

為了讓網站所有者能夠更精細地指定 Google 如何抓取他們的網站,Google 推出了 Search Console:網站所有者可以詳細指導我們如何處理其網頁,申請重新抓取,或使用 robots.txt 文件完全禁止抓取工具抓取他們的網站。Google 絕不接受網站為獲得更頻繁地抓取而付費的行為 - 我們為所有網站提供相同的工具,以確保盡可能為用戶提供最理想的搜索結果。

通過抓取查找信息

網絡就像一個規模與日俱增的圖書館,雖然收藏的圖書已有數十億本之多,卻沒有中央檔案管理系統。Google 使用一種稱為網頁抓取工具的軟件來發現供公眾訪問的網頁。抓取工具會查看網頁,并跟蹤訪問這些網頁上的鏈接,就好像您在網上瀏覽內容一樣。這類抓取工具會逐一訪問各個鏈接,并將各網頁的相關數據返回至 Google 的服務器。


通過編入索引整理信息

當抓取工具找到一個網頁時,Google 的系統就會像瀏覽器一樣呈現該網頁的內容。我們會記下關鍵信號(從關鍵字到網站新鮮度),然后會在 Google 搜索索引中跟蹤所有這些內容。

Google 搜索索引中包含數千億個網頁,其大小遠遠超過 1 億千兆字節。它就像圖書后部的索引一樣 - 編入索引的每個網頁上出現的每個字詞都對應著一個條目。在將某個網頁編入索引時,系統會將該網頁分別添加到其包含的所有字詞的對應條目中。






借助知識圖譜,Google 將繼續超越關鍵字匹配,以更好地了解您關注的人、地點和事物。為此,我們不僅要整理有關網頁的信息,還要整理其他類型的信息。如今,Google 搜索不僅可幫助您搜索大型圖書館內數百萬冊圖書中的內容,查找當地公交公司的線路和車次安排,還可幫助您瀏覽世界銀行等公開來源的數據。
分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏

Archiver|手機版|小黑屋|教你搜 ( 魯ICP備16006309號

GMT+8, 2025-3-15 01:56 , Processed in 0.317287 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表