|
2#

樓主 |
發表于 2021-2-7 00:29:41
|
只看該作者
Google 搜索的工作方式
Google 的工作方式是什么?下文將依次提供簡要版和詳盡版的回答。 Google 會從很多不同的來源獲取信息,包括: - 網頁;
- 用戶提交的內容,例如“Google 我的商家”和地圖用戶提交的內容;
- 圖書掃描;
- 互聯網上的公共數據庫;
- 以及許多其他來源。
但是,此頁面內容將重點介紹 Google 如何通過網頁獲取信息。 簡要版Google 按照以下三個基本步驟來生成基于網頁的結果: 抓取第一步是找出網絡上存在哪些網頁。不存在包含所有網頁的中央注冊表,因此 Google 必須不斷搜索新網頁并將其添加到已知網頁列表中。由于 Google 之前已經訪問過某些網頁,因此這些網頁是 Google 已知的網頁。當跟蹤已知網頁上指向新網頁的鏈接時,Google 會發現其他網頁。當網站所有者以列表形式([color=var(--devsite-link-color,#1a73e8)] 站點地圖)提交一系列網頁供 Google 抓取時,Google 也會發現其他網頁。如果您使用受管的網站托管服務,如 Wix 或 Blogger,這些服務可能會讓 Google 抓取您更新后的網頁或添加的新網頁。 Google 發現網頁網址后,會訪問或抓取該網頁以了解其中的內容。Google 會呈現該網頁,并分析文字和非文字內容以及整體視覺布局,確定該網頁應顯示在搜索結果中的什么位置。Google 越了解您的網站,就越能準確地將您的網站與正在查找您內容的用戶相匹配。 如何改善網站抓取效果: - 驗證 Google 能否訪問您網站上的網頁,以及這些網頁看起來是否正確。確保 Google 能以匿名用戶(沒有密碼和信息的用戶)的身份訪問網頁。Google 還應該能夠查看該網頁的所有圖片和其他元素,以便能夠正確了解該網頁。您可以在[color=var(--devsite-link-color,#1a73e8)]移動設備適合性測試工具
中輸入網頁網址快速檢查網頁。如果您創建或更新了單個網頁,您可以[color=var(--devsite-link-color,#1a73e8)]向 Google 提交具體網址。如需讓 Google 同時了解多個新網頁或更新后的網頁,您可以使用[color=var(--devsite-link-color,#1a73e8)]站點地圖。如果您想讓 Google 只抓取 1 個網頁,請將該網頁設為首頁。在 Google 看來,您的首頁就是您網站上最重要的網頁。為促成完整網站抓取,請確保您的首頁(以及所有網頁)包含一個良好的網站導航系統,能鏈接到您網站上的所有重要版塊和網頁。這會有助于用戶(和 Google)在您的網站上找到所需內容。對于小型網站(少于 1000 個網頁),只需讓 Google 知道您的首頁即可,前提是 Google 可以通過從首頁開始的鏈接路徑訪問所有其他網頁。將您的網頁鏈接到 Google 已知的其他網頁。但是,請務必注意,Google 不會跟蹤廣告中的鏈接、其他網站中由您付費的鏈接、評論中的鏈接或其他未遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網站站長指南的鏈接。
您無法通過向 Google 付費來提高網站抓取頻率或網站排名。任何關于 Google 會在收取費用后提高網站抓取頻率的消息均是子虛烏有。
編入索引發現網頁后,Google 會嘗試了解該網頁的內容。此過程稱為“編入索引”。Google 會分析該網頁的內容、為網頁上嵌入的圖片和視頻文件編制目錄,并通過其他方式嘗試了解網頁。這些信息存儲在 Google 索引中,而 Google 索引是一個存儲在很多很多計算機中的巨大數據庫。 如何改善網頁索引編制效果: - 制作簡短且有意義的網頁標題。
- 使用傳達網頁主題的網頁標題。
- 使用文字(而非圖片)傳達內容。(盡管 Google 能夠理解一些圖片和視頻,但相比圖片和視頻,文字更易于理解。請至少使用替代文本和其他屬性為[color=var(--devsite-link-color,#1a73e8)]視頻和[color=var(--devsite-link-color,#1a73e8)]圖片添加適當的注釋。)
呈現(和排名)當用戶輸入查詢時,Google 會根據許多因素嘗試從其索引中找到最相關的答案。Google 會努力確定最優質的答案,并會考慮其他因素(例如,考慮用戶所在位置、使用的語言及設備(桌面設備或手機)等因素),以便提供最佳用戶體驗和最恰當的答案。例如,在用戶搜索“自行車維修店”后,Google 向巴黎用戶顯示的答案與向香港用戶顯示的答案有所不同。Google 不會通過收取費用來提高網頁排名,網頁排名是以編程方式完成的。 要改善您的網頁呈現和排名效果,請注意以下事項: 詳盡版想要了解更多信息?下文是: [url=]詳盡版[/url]抓取抓取是指 [color=var(--devsite-link-color,#1a73e8)] Googlebot 訪問要添加到 Google 索引中的新網頁和更新后的網頁的過程。 我們使用大量計算機提取(或“抓取”)網絡上的數十億個網頁。執行抓取任務的程序叫做 Googlebot(也稱為漫游器或“蜘蛛”程序)。Googlebot 使用算法流程確定要抓取的網站、抓取頻率以及要從每個網站抓取的網頁數量。 Google 首先會根據一份網頁網址列表開始其抓取過程,該列表是在之前進行的抓取過程中生成的,且隨著網站所有者所提供的站點地圖數據的增多而不斷擴大。Googlebot 在訪問某個網頁時,會查找該網頁上的鏈接,并將這些鏈接添加到它要抓取的網頁的列表中。它會記錄新建立的網站、對現有網站進行的更改以及無效鏈接,并據此更新 Google 索引。 在抓取過程中,Google 會使用 Chrome 的最新版本呈現網頁。在呈現過程中,它會運行找到的所有網頁腳本。如果您的網站使用動態生成的內容,請務必[color=var(--devsite-link-color,#1a73e8)] 遵循 JavaScript SEO 基礎知識頁面上的要求。 主要抓取/輔助抓取
Google 使用兩種不同的抓取工具抓取網站:移動版抓取工具和桌面版抓取工具。每種抓取工具類型都會使用該類型的設備模擬訪問您網頁的用戶。 Google 使用 1 種抓取工具類型(移動版或桌面版)作為網站的主要抓取工具。網站上被 Google 抓取的所有網頁都是使用主要抓取工具抓取的。對所有新網站使用的主要抓取工具都是移動版抓取工具。 此外,Google 還會使用其他類型的抓取工具(移動版或桌面版)重新抓取網站上的一些網頁。這稱為輔助抓取,目的在于了解其他設備類型對您網站的適用情況。
Google 如何得知哪些網頁無法抓取?- robots.txt 中屏蔽的網頁無法抓取,但如果這些網頁鏈接到其他網頁,系統仍可能會將其編入索引。(Google 可以通過指向相應網頁的鏈接來推斷頁面內容,并且在不解析其內容的情況下將相應網頁編入索引。)
- Google 無法抓取任何匿名用戶無法訪問的網頁。因此,任何登錄或其他授權防護措施都將阻止 Google 抓取網頁。
- Google 不會頻繁地抓取先前已被抓取且被視為[color=var(--devsite-link-color,#1a73e8)]與其他網頁重復的網頁。
改善抓取質量利用以下這些技術幫助 Google 發現您網站上正確的網頁: - [color=var(--devsite-link-color,#1a73e8)]提交站點地圖。
- [color=var(--devsite-link-color,#1a73e8)]提交單個網頁的抓取請求。
- 針對網頁使用[color=var(--devsite-link-color,#1a73e8)]簡單易懂的邏輯網址路徑,并在網站中提供清晰直接的內部鏈接。
- 如果您在網站上使用網址參數進行導航,例如,如果您在全球購物網站上指明用戶所在的國家/地區,請[color=var(--devsite-link-color,#1a73e8)]使用網址參數工具告知 Google 關于重要參數的信息。
- 謹慎使用 robots.txt:使用 robots.txt 指明您希望 Google 優先了解或抓取哪些網頁,從而降低服務器負載,請勿將其作為阻止材料出現在 Google 索引中的方法。
- 使用 [color=var(--devsite-link-color,#1a73e8)]hreflang 指向其他語言版本的網頁。
- 明確指出[color=var(--devsite-link-color,#1a73e8)]規范網頁和備用網頁。
- 通過[color=var(--devsite-link-color,#1a73e8)]“索引涵蓋范圍”報告查看您的抓取和索引涵蓋范圍。
- 確保 Google 可以訪問主要網頁以及正確呈現網頁所需的重要資源(圖片、CSS 文件、腳本)。
- 用[color=var(--devsite-link-color,#1a73e8)]網址檢查工具檢查實際網頁,確認 Google 可以正常訪問并呈現您的網頁。
編入索引Googlebot 會處理它抓取的每個網頁,以便了解每個網頁的內容。這包括處理文字內容、關鍵內容標記和屬性,例如 <title> 標記和 Alt 屬性、圖片、視頻等。Googlebot 可處理多種類型的內容,但并不是所有類型的內容都能處理。例如,我們無法處理某些富媒體文件的內容。 在抓取和編入索引的間隙,Google 會確定網頁是否是另一網頁的[color=var(--devsite-link-color,#1a73e8)] 重復網頁或規范網頁。如果該網頁被視為重復網頁,Google 便不會頻繁地抓取它。類似網頁會歸入一個文檔中,其中列出了一個或多個網頁,包括規范網頁(這組網頁中最具代表性的網頁)和找到的所有重復網頁(可能只是訪問同一網頁的備用網址,或者可能是同一網頁的備用移動版或桌面版)。 請注意,Google 不會將包含 [color=var(--devsite-link-color,#1a73e8)] noindex 指令(標頭或標記)的網頁編入索引。但前提是 Google 必須能夠看到該指令;如果網頁被 [color=var(--devsite-link-color,#1a73e8)] robots.txt 文件、登錄頁或其他設備屏蔽了,那么即使 Google 并未訪問該網頁,也可能會將其編入索引! 改善編入索引的效果您可以通過多種技巧使 Google 更加了解您的網頁內容: - 使用 [color=var(--devsite-link-color,#1a73e8)]noindex 阻止 Google 抓取或找到您要隱藏的網頁。請勿對 robots.txt 屏蔽的網頁添加“noindex”;如果您這樣做,Google 將看不見“noindex”指令并且仍會將該網頁編入索引。
- [color=var(--devsite-link-color,#1a73e8)]使用結構化數據。
- 遵循 [color=var(--devsite-link-color,#1a73e8)]Google 網站站長指南。
- 查看 [color=var(--devsite-link-color,#1a73e8)]SEO 新手指南和[color=var(--devsite-link-color,#1a73e8)]高級用戶指南,了解更多提示。
什么是“文檔”? Google 在內部將網頁表示為大量文檔。每個文檔都表示一個或多個網頁。這些網頁完全相同或非常相似但本質上內容相同,可以通過不同網址訪問。文檔中的不同網址可能會指向完全相同的網頁(例如,example.com/dresses/summer/1234 和 example.com?product=1234 可能會顯示同一網頁),或同一網頁對使用不同設備的用戶來說具有細微差別(例如,example.com/mypage 適合桌面設備用戶,m.example.com/mypage 適合移動設備用戶)。 Google 會從文檔中選擇 1 個網址,并將其定義為該文檔的 規范網址。文檔的規范網址是 Google 最常抓取和編入索引的網址;其他網址會被視為重復網址或備用網址,并且 可能會偶爾被抓取,或根據用戶請求將其作為結果呈現:例如,如果文檔的規范網址是移動網址,Google 仍可能會為用桌面設備搜索的用戶提供桌面(備用)網址。 Search Console 中的大多數報告都會將數據歸到文檔的規范網址名下。某些工具(例如網址檢查工具)支持測試備用網址,但檢查規范網址也應提供有關備用網址的信息。 下面簡要說明了這些術語,以及這些術語在 Search Console 中的用法: - 文檔:一個類似網頁的集合。包含規范網址,如果您的網站有重復網頁,還包含備用網址。文檔中的網址可能來自相同或不同的組織(根域名,例如 www.google.com 中的“google”)。Google 會根據平臺(移動設備/桌面設備)、用戶語言‡或地理位置以及多個其他變量,選擇要顯示在搜索結果中的最佳網址。Google 會通過自然抓取或網站實現的功能發現網站上的相關網頁,這些功能包括重定向或 <link rel=alternate/canonical> 標記。其他組織的相關網頁只有在您網站通過重定向或鏈接標記明確編碼的情況下才會被標記為備用網頁。
- 網址:用于訪問網站上指定內容的網址。網站可能會將不同網址解析為指向同一網頁。
- 網頁:通過一個或多個網址訪問的指定網頁。網頁可能有不同的版本,具體取決于用戶的平臺(移動設備、桌面設備、平板電腦等)。
- 版本:網頁的一個變體,通常分為“移動版”、“桌面版”和“AMP”(但 AMP 網頁本身可以有移動版和桌面版)。每個版本都可以有不同網址(example.com 與 m.example.com)或相同網址(如果您的網站動態提供內容或使用自適應設計,那么同一網址可以顯示同一網頁的不同版本),具體取決于您的網站配置。語言變體不會被視為不同版本,而是被視為不同的文檔。
- 規范網頁或網址:Google 認為最能代表文檔的網址。Google 始終會抓取此網址,偶爾也會抓取文檔中的重復網址。
- 備用/重復網頁或網址:Google 可能會偶爾抓取的文檔網址。如果這些網址適合用戶和請求,Google 也會呈現這些網址(例如,會為在桌面設備上提出請求的桌面設備用戶提供備用網址,而不是規范移動網址)。
- 網站 (Site):通常用作網站 (website)(概念相關的一組網頁)的同義詞,但有時也可用作 Search Console 資源的同義詞,而實際上可以將資源定義為網站的一部分。網站可以跨子網域(甚至跨網域,如果具有正確關聯的 AMP 網頁的話)。
‡采用不同語言但具有相同內容的網頁會存儲在不同文檔中,這些文檔使用 hreflang 標記相互引用;這就是為什么務必要用 hreflang 標記翻譯內容的原因。
呈現結果用戶輸入查詢時,我們的機器會在索引中搜索匹配網頁,并返回我們認為與用戶搜索最相關的結果。相關性是由數百個因素決定的,我們一直在努力改進算法。Google 在選擇結果和對其進行排名時會考慮用戶體驗,因此請務必確保您的網頁能[color=var(--devsite-link-color,#1a73e8)] 快速加載且[color=var(--devsite-link-color,#1a73e8)] 適合移動設備。 改善結果呈現- 如果您的結果針對的是特定地點或使用特定語言的用戶,可以[color=var(--devsite-link-color,#1a73e8)]告知 Google 您的偏好。
- 確保您的網頁能[color=var(--devsite-link-color,#1a73e8)]快速加載且[color=var(--devsite-link-color,#1a73e8)]適合移動設備。
- 遵循[color=var(--devsite-link-color,#1a73e8)]網站站長指南,避免常見的潛在問題并提高網站排名。
- 考慮為您的網站[color=var(--devsite-link-color,#1a73e8)]實施搜索結果功能,例如食譜卡片或文章卡片。
- [color=var(--devsite-link-color,#1a73e8)]實施 AMP,以加快網頁在移動設備上的加載速度。某些 AMP 網頁也可以使用其他搜索功能,例如“焦點新聞”輪換展示。
- Google 的算法一直在不斷改進,您應遵循我們的指南,努力創建符合用戶需求的精彩內容,而不應嘗試去猜測算法并根據算法來設計網頁。
|
|