中文搜索引擎指南網(wǎng)

 找回密碼
 禁止注冊

QQ登錄

只需一步,快速開始

搜索
查看: 29231|回復(fù): 20
打印 上一主題 下一主題

百度搜索資源平臺工具使用手冊

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
1#
發(fā)表于 2021-2-14 20:01:33 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
平臺工具使用手冊最新更新章節(jié):2020-08-14
關(guān)鍵詞影響力,是百度搜索資源平臺針對站點對于關(guān)鍵詞數(shù)據(jù)分析的需求,推出的全新概念。涵蓋該關(guān)鍵詞下百度搜索可以為站點帶來的全部收益指標(biāo),包括:排名、百度搜索流量、展現(xiàn)量等。在H5版本的搜索資源平臺工具中首發(fā)的關(guān)鍵詞影響力工具檢測數(shù)值有:整體影響力、最大影響力、站點影響力。


為什么要驗證網(wǎng)站

搜索資源平臺推薦站長添加主站(您網(wǎng)站的鏈接也許會使用www 和非 www 兩種網(wǎng)址,建議添加用戶能夠真實訪問到的網(wǎng)址),添加并驗證后,可證明您是該域名的擁有者,可以快捷批量添加子站點,查看所有子站數(shù)據(jù),無需再一一驗證您的子站點。




如何驗證網(wǎng)站

百度搜索資源平臺提供三種驗證方式(百度統(tǒng)計的導(dǎo)入方式已下線):文件驗證、html標(biāo)簽驗證、CNAME驗證

1.文件驗證:您需要下載驗證文件,將文件上傳至您的服務(wù)器,放置于域名根目錄下。

2.html標(biāo)簽驗證:將html標(biāo)簽添加至網(wǎng)站首頁html代碼的<head>標(biāo)簽與</head>標(biāo)簽之間。

3.CNAME驗證:您需要登錄域名提供商或托管服務(wù)提供商的網(wǎng)站,添加新的DNS記錄。

驗證完成后,我們將會認(rèn)為您是網(wǎng)站的擁有者。為使您的網(wǎng)站一直保持驗證通過的狀態(tài),請保留驗證的文件、html標(biāo)簽或CNAME記錄,我們會去定期檢查驗證記錄。



網(wǎng)站驗證常見錯誤及解決辦法


常見錯誤
推薦解決辦法
無法解析您網(wǎng)站的域名
請檢查網(wǎng)站的DNS設(shè)置是否正確,并更新您網(wǎng)站自己的DNS
無法連接到您網(wǎng)站的服務(wù)器
請檢查網(wǎng)站服務(wù)器設(shè)置是否正確,是否可正常訪問
獲取驗證文件或網(wǎng)頁發(fā)生錯誤
請檢查服務(wù)器設(shè)置,或者稍后重試
您網(wǎng)站跳轉(zhuǎn)次數(shù)過多
請檢查服務(wù)器設(shè)置,是否設(shè)置了多次跳轉(zhuǎn),如果設(shè)置了多次跳轉(zhuǎn),請取消跳轉(zhuǎn)后重新嘗試驗證您的網(wǎng)站
服務(wù)器檢查結(jié)果為空
請檢查服務(wù)器是否對百度做了特殊的設(shè)置(例如:對百度進行了封禁),或者稍后重試
我們無法訪問您的網(wǎng)站
請檢查服務(wù)器設(shè)置是否正確,可能是您的網(wǎng)站是否對百度做了UA/IP封禁,如果做了封禁請解除封禁后重新嘗試驗證您的網(wǎng)站
找不到驗證的html標(biāo)簽或者驗證的html標(biāo)簽內(nèi)容錯誤
請檢查html標(biāo)簽內(nèi)容是否正確
驗證的文件內(nèi)容錯誤
請檢查html標(biāo)簽內(nèi)容是否正確
沒有找到對應(yīng)的DNS CNAME記錄
請檢查您網(wǎng)站的DNS設(shè)置是否正確
您的網(wǎng)站跳轉(zhuǎn)到另一個域名下
請檢查服務(wù)器是否設(shè)置了跳轉(zhuǎn),如果設(shè)置了請去掉跳轉(zhuǎn)后重新嘗試驗證您的網(wǎng)站

點擊查看站點驗證圖文詳解



分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏
2#
 樓主| 發(fā)表于 2021-2-14 20:02:07 | 只看該作者
如何選擇普通收錄方式

API推送:最為快速的提交方式,建議您將站點當(dāng)天新產(chǎn)出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時被百度收錄。

sitemap:您可以定期將網(wǎng)站鏈接放到Sitemap中,然后將Sitemap提交給百度。百度會周期性的抓取檢查您提交的Sitemap,對其中的鏈接進行處理,但收錄速度慢于API推送。

手動提交:如果您不想通過程序提交,那么可以采用此種方式,手動將鏈接提交給百度。


自動推送:輕量級鏈接提交組件,將自動推送的JS代碼放置在站點每一個頁面源代碼中,當(dāng)頁面被訪問時,頁面鏈接會自動推送給百度,有利于新頁面更快被百度發(fā)現(xiàn)。




使用API推送功能會達到怎樣效果

及時發(fā)現(xiàn):可以縮短百度爬蟲發(fā)現(xiàn)您站點新鏈接的時間,使新發(fā)布的頁面可以在第一時間被百度收錄
  保護原創(chuàng):對于網(wǎng)站的最新原創(chuàng)內(nèi)容,使用API推送功能可以快速通知到百度,使內(nèi)容可以在轉(zhuǎn)發(fā)之前被百度發(fā)現(xiàn)



如何使用API推送功能

1,需要網(wǎng)站制作數(shù)據(jù)推送接口,進入API推送工具后,會看到接口調(diào)用地址的token,token是由16個英文數(shù)字組合的字符串


2,下面提供一些推送示例
1)curl推送示例
將要提交的url數(shù)據(jù)寫入一個本地文件,比如urls.txt,每個url占一行,然后調(diào)用curl命令:
curl -H 'Content-Type:text/plain' --data-binary @urls.txt
"http://data.zz.baidu.com/urls?site=www.example.com&token=edk7yc4rEZP9pDQD"
使用php、python、java等可以參照這個過程推送結(jié)構(gòu)化數(shù)據(jù)。

2)post推送示例
POST /urls?site=www.58.com&token=edk7ychrEZP9pDQD HTTP/1.1
User-Agent: curl/7.12.1
Host: data.zz.baidu.com
Content-Length: 83
http://www.example.com/1.html
http://www.example.com/2.html

3)php推送示例
$urls = array(
    'http://www.example.com/1.html',
    'http://www.example.com/2.html',
);
$api = 'http://data.zz.baidu.com/urls
site=www.58.com&token=edk7ychrEZP9pDQD';
$ch = curl_init();
$options =  array(
    CURLOPT_URL => $api,
    CURLOPT_POST => true,
    CURLOPT_RETURNTRANSFER => true,
    CURLOPT_POSTFIELDS => implode("\n", $urls),
    CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
);
curl_setopt_array($ch, $options);
$result = curl_exec($ch);
echo $result;

4)ruby推送示例
require 'net/http'
urls = ['http://www.example.com/1.html', 'http://www.example.com/2.html']
uri = URI.parse('http://data.zz.baidu.com/urls
site=www.xxx.com&token=eTk7ychrWZP1pDQD')
req = Net::HTTP::Post.new(uri.request_uri)
req.body = urls.join("\n")
req.content_type = 'text/plain'
res = Net::HTTP.start(uri.hostname, uri.port) { |http| http.request(req) }
puts res.body

如何查看推送反饋

您可以通過推送后返回的狀態(tài)碼和字段來判斷數(shù)據(jù)是否推送成功。
1,狀態(tài)碼為200,表示推送成功,可能返回以下字段:

字段

是否必選

參數(shù)類型

說明


success

int

成功推送的url條數(shù)


remain

int

當(dāng)天剩余的可推送url條數(shù)


not_same_site

array

由于不是本站url而未處理的url列表


not_valid

array

不合法的url列表

成功返回示例:
{
   "remain":4999998,
   "success":2,
   "not_same_site":[],
   "not_valid":[]
}

2,狀態(tài)碼為4XX或500,表示推送失敗,返回字段有:

字段

是否必選

類型

說明


error

int

錯誤碼,與狀態(tài)碼相同


message

string

錯誤描述


常見的推送失敗返回示例說明:

error

message

含義

400

site error

站點未在站長平臺驗證

empty content

post內(nèi)容為空

only 2000 urls are allowed once

每次最多只能提交2000條鏈接

over quota

超過每日配額了,超配額后再提交都是無效的

401

token is not valid

token錯誤

404

not found

接口地址填寫錯誤

500

internal error, please try later

服務(wù)器偶然異常,通常重試就會成功


API推送功能常見問題

1, 和原來的sitemap提交接口有什么區(qū)別?
        答:狀態(tài)反饋更及時了,原來提交后需要登錄到搜索資源平臺查看提交是否成功。目前只要根據(jù)提交后返回的數(shù)據(jù)就可以判斷了。

2, 已經(jīng)存在的提交sitemap數(shù)據(jù)的程序代碼需要做什么修改?
        答:主要修改兩點。第一點,提交的接口需要修改;第二點,需要處理下接口返回的信息,失敗后需要根據(jù)錯誤進行相應(yīng)處理,報錯的鏈接是無法提交成功的

3,為什么提交成功后看不到數(shù)據(jù)變化?
        答:我們反饋的是新提交鏈接的數(shù)量,如果您提交的鏈接在之前提交過(即重復(fù)提交)是不會被統(tǒng)計到的

4,在什么時機使用API推送提交功能效果最明顯?
        答:頁面鏈接產(chǎn)生或發(fā)布時立即提交,這樣效果是最好的

5,每次提交一條數(shù)據(jù)和多條數(shù)據(jù)有什么區(qū)別?
        答:沒有區(qū)別

6,重復(fù)提交已經(jīng)發(fā)布的鏈接會有什么問題?
        答:會有兩個影響。第一,將浪費您提交的配額,每個站點每天可提交的數(shù)量是有限制的,如果您都提交了舊鏈接,當(dāng)有新鏈接時可能因為配額耗盡無法提交。第二,如果您經(jīng)常重復(fù)提交舊鏈接,我們會下調(diào)您的配額,您可能會失去API推送功能的權(quán)限

7,API推送可以推多少條鏈接?
        答:API推送可提交的鏈接數(shù)量上限是根據(jù)您提交的新產(chǎn)生有價值鏈接數(shù)量而決定的,百度會根據(jù)您提交數(shù)量的情況不定期對上限額進行調(diào)整,提交的新產(chǎn)生有價值鏈接數(shù)量越多,可提交鏈接的上限越高。

什么是Sitemap

Sitemap(即站點地圖)就是您網(wǎng)站上各網(wǎng)頁的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。

百度對已提交的數(shù)據(jù),不保證一定會抓取及索引所有網(wǎng)址。但是,我們會使用Sitemap中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進抓取策略,并在日后能更好地對網(wǎng)站進行抓取。

此外,Sitemap 與搜索排名沒有關(guān)系。



百度Sitemap支持哪些格式

百度Sitemap協(xié)議支持文本格式和xml格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:

1.第一種格式樣例:txt文本格式

在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過搜索資源平臺進行提交   
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html  

此文本文件需要遵循以下指南:
· 文本文件每行都必須有一個網(wǎng)址。網(wǎng)址中不能有換行。
· 不應(yīng)包含網(wǎng)址列表以外的任何信息。
· 您必須書寫完整的網(wǎng)址,包括 http。
· 每個文本文件最多可包含 50,000 個網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
· 文本文件需使用 UTF-8 編碼或GBK編碼。  


2.第二種格式樣例:xml格式

單個xml數(shù)據(jù)格式如下:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<urlset>
<!--必填標(biāo)簽-->
    <url>
        <!--必填標(biāo)簽,這是具體某一個鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 -->
        <loc>http://www.yoursite.com/yoursite.html</loc>
        <!--必填,URL鏈接地址,長度不得超過256字節(jié)-->
        <lastmod>2009-12-14</lastmod>
        <!--可以不提交該標(biāo)簽,用來指定該鏈接的最后更新時間-->
        <changefreq>daily</changefreq>
        <!--可以不提交該標(biāo)簽,用這個標(biāo)簽告訴此鏈接可能會出現(xiàn)的更新頻率 -->
        <priority>0.8</priority>
        <!--可以不提交該標(biāo)簽,用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間-->
    </url>
    <url>
        <loc>http://www.yoursite.com/yoursite2.html</loc>
        <lastmod>2010-05-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
上述Sitemap向百度提交了一個url:http://www.yoursite.com/yoursite.html


若有多條url,按照上述格式重復(fù)<url></url>之間的片斷,列明所有url地址,打包到一個xml文件,向搜索資源平臺進行提交。



創(chuàng)建Sitemap時有哪些注意事項?

第一,一個Sitemap文件包含的網(wǎng)址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的Sitemap超過了這些限值,請將其拆分為幾個小的Sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會因提供大文件而超載。

第二,一個站點支持提交的sitemap文件個數(shù)必須小于5萬個,多于5萬個后會不再處理,并顯示“鏈接數(shù)超”的提示。   

第三,如果驗證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。

第四,搜索資源平臺sitemap文件提交已不再支持索引型文件形式,歷史提交的索引型文件已不再進行抓取,建議站長及時刪除,重新進行資源提交。



如何提交Sitemap

第一步,將需提交的網(wǎng)頁列表制作成一個Sitemap文件,文件格式請閱讀百度Sitemap協(xié)議都支持哪些格式。
  第二步,將Sitemap文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為example.com,您已制作了一個sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
  第三步,登錄百度搜索資源平臺,確保提交Sitemap數(shù)據(jù)的網(wǎng)站已驗證歸屬。
  第四步,進入Sitemap工具,點擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址
  最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點擊更新所選,即對更新的網(wǎng)站鏈接進行了提交。


什么是移動Sitemap協(xié)議,如何提交移動Sitemap協(xié)議

百度推出了移動Sitemap協(xié)議,用于將網(wǎng)址提交給移動搜索收錄。百度移動Sitemap協(xié)議是在標(biāo)準(zhǔn)Sitemap協(xié)議基礎(chǔ)上制定的,增加了<mobile:mobile/>標(biāo)簽,它有四種取值:
<mobile:mobile/> :移動網(wǎng)頁
<mobile:mobile type="mobile"/> :移動網(wǎng)頁      
<mobile:mobile type="pc,mobile"/>:自適應(yīng)網(wǎng)頁
<mobile:mobile type="htmladapt"/>:代碼適配

無該上述標(biāo)簽表示為PC網(wǎng)頁

下方樣例相當(dāng)于向百度移動搜索提交了一個移動網(wǎng)頁:http://m.example.com/index.html,向PC搜索提交了一個傳統(tǒng)網(wǎng)頁:http://www.example.com/index.html,同時向移動搜索和PC搜索提交了一個自適配網(wǎng)頁http://www.example.com/autoadapt.html
<?xml version="1.0" encoding="UTF-8" ?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
<url>
<loc>http://m.example.com/index.html</loc>
<mobile:mobile type="mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/index.html</loc>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/autoadapt.html</loc>
<mobile:mobile type="pc,mobile"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/htmladapt.html</loc>
<mobile:mobile type="htmladapt"/>
<lastmod>2009-12-14</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>

按照移動Sitemap協(xié)議做好Sitemap后,在Sitemap工具點擊添加新數(shù)據(jù)提交,與提交普通Sitemap方式一致。


我提交時填寫的周期是什么含義?

百度Spider會參考設(shè)置周期抓取Sitemap文件,因此請根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置。請注意若url不變而僅是url對應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。Sitemap工具不能解決頁面更新問題。


Sitemap提交后,多久能被百度處理?

Sitemap數(shù)據(jù)提交后,一般在1小時內(nèi)百度會開始處理。在以后的調(diào)度抓取中,如果您的sitemap支持etag,我們會更頻繁抓取sitemap文件,從而及時發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會比較長。


提交的Sitemap都會被百度抓取并收錄嗎?

百度對已提交的數(shù)據(jù),不保證一定會抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。


XML格式的 Sitemap 中,“priority”提示會影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?

不會。Sitemap 中的“priority”提示只是說明該網(wǎng)址相對于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會影響網(wǎng)頁在搜索結(jié)果中的排名。


網(wǎng)址在 Sitemap 中的位置是否會影響它的使用?

不會。網(wǎng)址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。


Sitemap中提交的url能否包含中文?

因為轉(zhuǎn)碼問題建議最好不要包含中文。




什么是自動推送工具?自動推送工具解決了什么問題?

自動推送JS代碼是百度搜索資源平臺最新推出的輕量級鏈接提交組件,站長只需將自動推送的JS代碼放置在站點每一個頁面源代碼中,當(dāng)頁面被訪問時,頁面鏈接會自動推送給百度,有利于新頁面更快被百度發(fā)現(xiàn)。

為了更快速的發(fā)現(xiàn)站點每天產(chǎn)生的最新內(nèi)容,百度搜索資源平臺推出API推送工具,產(chǎn)品上線后,部分站長反饋使用API推送方式的技術(shù)門檻較高,于是我們順勢推出更低成本的JS自動推送工具。一步安裝便可實現(xiàn)頁面自動推送,低成本,高收益。


自動推送代碼如何安裝使用?

站長需要在每個頁面的HTML代碼中包含以下自動推送JS代碼:

<script>
(function(){
    var bp = document.createElement('script');
    var curProtocol = window.location.protocol.split(':')[0];
    if (curProtocol === 'https'){
   bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
  }
  else{
  bp.src = 'http://push.zhanzhang.baidu.com/push.js';
  }
    var s = document.getElementsByTagName("script")[0];
    s.parentNode.insertBefore(bp, s);
})();
</script>

如果站長使用PHP語言開發(fā)的網(wǎng)站,可以按以下步驟操作:
1、創(chuàng)建名為“baidu_js_push.php”的文件,文件內(nèi)容是上述自動推送JS代碼;
2、在每個PHP模板頁文件中的 <body> 標(biāo)記后面添加一行代碼:
<?php include_once("baidu_js_push.php") ?>


為什么自動推送可以更快的將頁面推送給百度搜索?

基于自動推送的實現(xiàn)原理問題,當(dāng)新頁面每次被瀏覽時,頁面URL會自動推送給百度,無需站長匯總URL再進行API推送操作。

借助用戶的瀏覽行為來觸發(fā)推送動作,省去了站長人工操作的時間。


自動推送和API推送有什么區(qū)別?

已經(jīng)在使用普通收錄提交里的API推送(或sitemap)的網(wǎng)站還需要再部署自動推送代碼嗎?

二者之間互不沖突,互為補充。已經(jīng)使用API推送的站點,依然可以部署自動推送的JS代碼,二者一起使用。


什么樣的網(wǎng)站更適合使用自動推送?

自動推送由于實現(xiàn)便捷和后續(xù)維護成本低的特點,適合技術(shù)能力相對薄弱,無能力支持全天候?qū)崟r主動推送程序的站長。

站長僅需一次部署自動推送JS代碼的操作,就可以實現(xiàn)新頁面被瀏覽即推送的效果,低成本實現(xiàn)鏈接自動提交。

同時,我們也支持API推送和自動推送代碼配合使用,二者互不影響。



回復(fù)

使用道具 舉報

3#
 樓主| 發(fā)表于 2021-2-14 20:02:28 | 只看該作者
什么是快速收錄?

快速收錄工具可以向百度搜索主動推送資源,縮短爬蟲發(fā)現(xiàn)網(wǎng)站鏈接的時間,對于高實效性內(nèi)容推薦使用快速收錄工具,實時向搜索推送資源。

開發(fā)者可通過快速收錄工具,向百度搜索主動提交站點新增的高時效性資源,縮短爬蟲發(fā)現(xiàn)網(wǎng)站鏈接的時間,一般情況下48小時內(nèi)即可實現(xiàn)收錄。

需要注意的是,快速收錄僅限于提交移動端頁面及移動端自適應(yīng)頁面。


如何優(yōu)先獲得快速收錄權(quán)益?

開發(fā)者將站點與小程序相關(guān)聯(lián),提交適配規(guī)則,順利將較多的H5資源替換為小程序資源,使小程序在百度搜索中獲得較多分發(fā)與展現(xiàn),就能優(yōu)先獲得快速收錄權(quán)益。

如果開發(fā)者尚未開通小程序,且在快速收錄工具界面有“一鍵創(chuàng)建并關(guān)聯(lián)小程序”字樣,點擊即可一鍵創(chuàng)建并關(guān)聯(lián)小程序,然后便可以參考《配置 URL 適配規(guī)則》提交適配規(guī)則,將H5資源替換為小程序資源。

如果開發(fā)者尚未開通小程序,且在快速收錄工具界面沒有“一鍵創(chuàng)建并關(guān)聯(lián)小程序”字樣,可在智能小程序開發(fā)者平臺參考《智能小程序注冊指導(dǎo)文檔》創(chuàng)建發(fā)布小程序,然后參考《關(guān)聯(lián) H5 站點》關(guān)聯(lián)站點,最后提交適配規(guī)則,將H5資源替換為小程序資源,可參考《配置 URL 適配規(guī)則》

如果開發(fā)者已開通小程序,可直接在智能小程序開發(fā)者平臺關(guān)聯(lián)H5站點并提交適配規(guī)則,可分別參考《關(guān)聯(lián) H5 站點》《配置 URL 適配規(guī)則》


特別提醒的是,一個小程序只能為一個站點帶來權(quán)益,請開發(fā)者合理設(shè)置關(guān)聯(lián),確保小程序與H5站點的穩(wěn)定關(guān)聯(lián)狀態(tài),以便權(quán)益正常使用、適配正常生效。如果站點與小程序的關(guān)聯(lián)關(guān)系不在了,快速收錄權(quán)益也將失效。


資源提交與數(shù)據(jù)反饋

快速收錄包含手動提交和API提交兩種方式,使用API提交時請使用平臺提供的最新接口進行推送。



提交資源即占用配額,請謹(jǐn)慎選擇提交方式,并盡量保證站點符合移動體驗標(biāo)準(zhǔn),提交優(yōu)質(zhì)資源。開發(fā)者可參考《百度搜索優(yōu)質(zhì)內(nèi)容指南》《百度APP移動搜索落地頁體驗白皮書5.0》,優(yōu)化資源質(zhì)量。

另外,如果網(wǎng)站已通過HTTPS認(rèn)證工具驗證為HTTPS網(wǎng)站,請確保所提交鏈接的協(xié)議頭為HTTPS。


提交資源后,可通過“數(shù)據(jù)反饋”查看資源提交量及收錄情況。



回復(fù)

使用道具 舉報

4#
 樓主| 發(fā)表于 2021-2-14 20:02:53 | 只看該作者
什么是死鏈&死鏈的標(biāo)準(zhǔn)

頁面已經(jīng)無效,無法對用戶提供任何有價值信息的頁面就是死鏈接,包括協(xié)議死鏈和內(nèi)容死鏈兩種形式:
  1)協(xié)議死鏈:頁面的TCP協(xié)議狀態(tài)/HTTP協(xié)議狀態(tài)明確表示的死鏈,常見的如404、403、503狀態(tài)等。
  2)內(nèi)容死鏈:服務(wù)器返回狀態(tài)是正常的,但內(nèi)容已經(jīng)變更為不存在、已刪除或需要權(quán)限等與原內(nèi)容無關(guān)的信息頁面。
  目前內(nèi)容死鏈召回存在召回率的風(fēng)險,所以建議各位站長盡量使用協(xié)議死鏈,以保證平臺工具更好地發(fā)揮其作用。


為什么要使用死鏈工具

當(dāng)網(wǎng)站死鏈數(shù)據(jù)累積過多時,并且被展示到搜索結(jié)果頁中,對網(wǎng)站本身的訪問體驗和用戶轉(zhuǎn)化都起到了負(fù)面影響。另一方面,百度檢查死鏈的流程也會為網(wǎng)站帶來額外負(fù)擔(dān),影響網(wǎng)站其他正常頁面的抓取和索引。


如何使用死鏈工具

第一步,處理網(wǎng)站已存在的死鏈,制作死鏈文件篩查網(wǎng)站內(nèi)部存在的死鏈,并將這些死鏈頁面設(shè)置成為404頁面,即百度訪問它們時返回404代碼。將需提交的死鏈列表制作成一個死鏈文件,制作方法請參閱幫助文檔(與sitemap格式及制作方法一致)

第二步,將死鏈文件放置在網(wǎng)站根目錄下
比如您的網(wǎng)站為example.com,您已制作了一個silian_example.xml死鏈文件,則將silian_example.xml上傳至網(wǎng)站根目錄即example.com/silian_example.xml。特別提醒,索引型死鏈sitemap文件不予處理,請勿提交索引型死鏈sitemap文件。

第三步,登錄百度搜索資源平臺

第四步,提交網(wǎng)站并驗證歸屬:具體驗證網(wǎng)站歸屬方法可見幫助文檔

第五步,提交死鏈數(shù)據(jù)

    1.通過搜索資源平臺-搜索服務(wù)-資源提交-死鏈提交,到達操作頁面;

    2.填寫死鏈文件更新周期,可選“每隔xx小時/天更新一次”;

    3.填寫死鏈文件地址,請留意提交框右側(cè)的配額提示;


    4.管理已提交的死鏈列表,可查看死鏈文件狀態(tài)和死鏈處理狀態(tài)。






提交完之后,可在死鏈工具列表里看到提交的死鏈文件,如果死鏈文件里面有新的死鏈,可以選擇文件后,點擊更新所選,即對更新的死鏈鏈接進行了提交。整體流程如下圖:



死鏈提交工具常見問題問:百度不是會自動識別死鏈嗎?這個工具有什么附加作用?
答:Baiduspider發(fā)現(xiàn)并處理死鏈?zhǔn)切枰獣r間的,使用工具可以將最耗時的“發(fā)現(xiàn)”過程縮到最短。同時死鏈提交工具還可以與其它平臺工具配合使用。

問:死鏈提交工具的生效周期是怎樣的?
答:死鏈抓取后生效時間為一周,如超時未生效,請在反饋中心提交反饋。

問:百度死鏈提交支持這種形式嗎?*.a.example.com
答:不支持,需要做成xml或txt文件上傳提交。

問:提交死鏈的文件和sitemap中的URL列表有沖突會不會有負(fù)面影響
答:如果該url為死鏈,不會通過sitemap收錄該url;如果該url為活鏈,有可能影響死鏈文件的整體生效。

問:死鏈提交工具直接提交一整個目錄嗎?
答:不可以,目前沒有此功能。
問:死鏈提交工具支持索引型sitemap文件嗎?
答:不支持,請勿提交索引型死鏈sitemap文件。







回復(fù)

使用道具 舉報

5#
 樓主| 發(fā)表于 2021-2-14 20:03:11 | 只看該作者
使用網(wǎng)站改版工具前,站點應(yīng)該做哪些工作

1)首先您要將改版前的舊鏈接全部通過301跳轉(zhuǎn)到改版后的新鏈接,并且這種跳轉(zhuǎn)必須是一一對應(yīng)的關(guān)系,不能出現(xiàn)多條舊鏈接跳轉(zhuǎn)到一條新鏈接,或者一條舊鏈接在不同時間內(nèi)跳轉(zhuǎn)到不同新鏈接的情況。
  2)如果改版后產(chǎn)生新的站點,無論是www主站點還是二級域名,都需要將新站點在百度搜索資源平臺進行驗證,以保證明您擁有該站點的管理權(quán)限。

網(wǎng)站改版工具如何使用

當(dāng)一個站點的域名或者目錄發(fā)生變化時,例如a.com變?yōu)閎.com,或者a.com/b變成a.com/c,如果想讓百度快速收錄變化之后的新鏈接、用以替換之前的舊鏈接,那么您就需要使用百度搜索資源平臺的網(wǎng)站改版工具來提交您的改版關(guān)系,加速百度對已收錄鏈接的新舊替換。目前網(wǎng)站改工具支持以下方式的改版:

1)換域名:僅域名發(fā)生了變換,如www.a.com變?yōu)閇url]www.b.com[/url],而目錄結(jié)構(gòu)沒有任何變化。可以在網(wǎng)站改版工具的“添加改版規(guī)則”——“站點改版”處,添加改版前后的兩個域名,提交即可。注意此處提交的前后域名必須是不同的。

2)目錄結(jié)構(gòu)改版:不管域名是否改變,目錄結(jié)構(gòu)發(fā)生了變化,如www.a.com/a變?yōu)?a target="_blank">www.a.com/b,或又如www.a.com/c變?yōu)閏.a.com。可以在網(wǎng)站改版工具的“添加改版規(guī)則”——“規(guī)則改版”處,提交新舊目錄正則式,正則式的書寫方式詳見“正則格式說明”。

3)部分URL改版:當(dāng)您的網(wǎng)站點僅有部分URL發(fā)生了改版,正則式不能滿足改版形式的表達,或前兩種方式提交的規(guī)則校驗失敗,您還可以通過提交url對文件,將已經(jīng)改版的舊鏈接和對應(yīng)的新鏈接提交給百度:文件格式為每行前后兩個url,分別是改版前舊鏈接和跳轉(zhuǎn)后新鏈接,中間用空格分隔,一個文件最多可以提交5萬對url,您可以提交多個文件。另外您還可以在輸入框中直接輸入url對,格式與文件相同,但這處一次性僅限提交2000對url。

在您提交改版規(guī)則后, 網(wǎng)站改版工具會提供狀態(tài)說明:

1)規(guī)則校驗中:百度搜索資源平臺會對管理員提交的改版規(guī)則進行校驗,當(dāng)認(rèn)為實際情況與您提交的規(guī)則相符時,才會對規(guī)則進行生效處理,這個校驗時間最長為2小時。

2)校驗失敗:當(dāng)百度搜索資源平臺發(fā)現(xiàn)站點存在如下問題時,會判為校驗失敗,不會進行后續(xù)的生效處理:
  a、提交重復(fù)規(guī)則:如果您當(dāng)前提交的規(guī)則包含了正在生效的規(guī)則(狀態(tài)為改版中或改版完成),則認(rèn)定新提交的規(guī)則無效,您需要刪除舊規(guī)則后再提交新規(guī)則,或者直接修改新規(guī)則。
  b、未設(shè)置301跳轉(zhuǎn):對于存在改版關(guān)系的url對,我們要求通過301進行跳轉(zhuǎn)。
  c、舊鏈抓取失敗:改版規(guī)則中舊鏈接無法正常訪問。
  d、新鏈抓取失敗:改版規(guī)則中新鏈接、即跳轉(zhuǎn)過去的鏈接無法正常訪問。
  e、跳轉(zhuǎn)關(guān)系與規(guī)則不符:您提交的三種規(guī)則必須是真實的url對跳轉(zhuǎn)關(guān)系,否則不予通過。
  f、url與所提交站點不匹配:三種規(guī)則都會要求您填寫新舊鏈接對應(yīng)的站點信息,如果提交的url對與站點信息不匹配會報此錯誤信息。
  g、正則格式不正確:請按照規(guī)定的格式進行填寫,詳見:“正則格式說明”。
  h、url對文件格式不正確:要求的url對文件格式為:每行有兩個url,用空格分隔,最多5萬行。
  i、多跳一:鏈接跳轉(zhuǎn)關(guān)系中出現(xiàn)了多條鏈接跳轉(zhuǎn)到一條鏈接的情況。

這些錯誤信息會抽樣展示在錯誤詳情頁面中。

3)無需改版:網(wǎng)站改版工具只適用于改版前的舊鏈接已被百度收錄,對于未收錄的舊鏈接,我們無法進行處理。

4)改版進行中:您提交的改版規(guī)則通過校驗后,百度搜索資源平臺會進行生效處理,這個過程最長為48小時。

5)改版完成:百度已經(jīng)根據(jù)您提交的改版規(guī)則對新舊鏈接進行了替換。

請注意,改版完成后,百度會持續(xù)一段時間例行檢查改版規(guī)則在您網(wǎng)站的生效狀態(tài),一旦連續(xù)發(fā)現(xiàn)改版規(guī)則出現(xiàn)校驗失敗原因中的問題,該規(guī)則的狀態(tài)會由“改版完成”調(diào)整為“校驗失敗”狀態(tài),此時需要您修正站內(nèi)異常并重新提交改版規(guī)則。所以請盡可能長時間(至少三個月)保持新舊鏈接的跳轉(zhuǎn)關(guān)系。



網(wǎng)站改版工具注意事項  1)改版規(guī)則中的新舊鏈接一定要使用301的方式進行跳轉(zhuǎn)。
  2)建議您盡量使用站點改版和規(guī)則改版,會有比較短的處理周期,也縮短后續(xù)您反饋問題的追查用時。
  3)百度搜索資源平臺對改版規(guī)則的校驗時間范圍為0.5——2小時,改版生效時間范圍為12——48小時,整體來看,您從提交改版規(guī)則到線上生效,最短12.5小時,最長50小時。
  4)改版完成后不要立即清除跳轉(zhuǎn)關(guān)系,保持跳轉(zhuǎn)關(guān)系至少三個月,網(wǎng)站避免出現(xiàn)校驗失敗原因中的問題。


正則格式說明

以站點news.a.com改版到站點a.com/news為例:
改版前url地址為http://news.a.com/09/1001/07/5KH8DE1F000120GR.html
其對應(yīng)的改版后url地址為http://a.com/news/09/1001/07/5KH8DE1F000120GR.html

步驟一:確定改版前鏈接中的可替換參數(shù)或者路徑,得到其位置序號和類型。
改版前頁url:

根據(jù)網(wǎng)站自身url的層次結(jié)構(gòu),其中09,1001,07和5KH8DE1F000120GR為動態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數(shù)字混合外,其余均為純數(shù)字。

步驟二:根據(jù)可替換參數(shù)或路徑的類型,得到改版后鏈接的表達形式。
使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示字母數(shù)字下劃線組成的字符串。


步驟三:根據(jù)改版后url,以及可替換參數(shù)在步驟一中的位置序號,依次用${1},${2},……表示替換掉改版前url中的可替換參數(shù)或路徑,得到改版后鏈接pattern形式。


至此,便得到了改版前后的規(guī)則:
http://news.a.com /(\d+)/(\d+)/(\d+)/(\w+).html
http://a.com/news/${1}/${2}/${3}/${4}.html





回復(fù)

使用道具 舉報

6#
 樓主| 發(fā)表于 2021-2-14 20:03:48 | 只看該作者
什么是站點索引量  站點中有多少頁面可以作為搜索候選結(jié)果,就是一個網(wǎng)站的索引量。
  站點內(nèi)容頁面需要經(jīng)過搜索引擎的抓取和層層篩選后,方可在搜索結(jié)果中展現(xiàn)給用戶。頁面通過系統(tǒng)篩選,并被作為搜索候選結(jié)果的過程,即為建立索引。
  目前site語法的數(shù)值是索引量估算值,比較不準(zhǔn)。推薦站長們使用我們的新工具,同時我們也正在努力改進site語法。


如何使用百度索引量工具第一步,注冊并登錄百度搜索資源平臺
第二步,提交網(wǎng)站并驗證歸屬,具體驗證網(wǎng)站歸屬方法可見幫助文檔
第三步,選擇“搜索服務(wù)-數(shù)據(jù)統(tǒng)計-索引量”,定制百度索引量查看規(guī)則
第四步,得到站點的百度索引量數(shù)據(jù)。


如何定制百度索引量查看規(guī)則
  可以通過“*”號自定義規(guī)則來查看某些特征集合的頁面索引量數(shù)據(jù)。“*”號放在規(guī)則結(jié)尾可匹配到包含“/”在內(nèi)的任意字符串,放在規(guī)則其他位置匹配不包含“/”的任意字符串,具體可參考下列示例:
1.http://*.baidu.com/* 表示 http://baidu.com/ 站點及其子站的所有頁面
2.http://wenku.baidu.com/* 表示 http://wenku.baidu.com/ 站點下的所有(包含各級子目錄)頁面
3.http://wenku.baidu.com/doc/* 表示 http://wenku.baidu.com/ 站點下 doc 目錄下(包含各級子目錄)的頁面
4.http://wenku.baidu.com/doc/*/ 表示 http://wenku.baidu.com/ 站點下 doc 目錄下的頁面,不含這些頁面下的子目錄頁面
5.http://wenku.baidu.com/doc*/* 表示 http://wenku.baidu.com/ 站點下以 doc 開頭的目錄下(包含各級子目錄)的頁面


百度索引量工具常見問題
問:工具里展示的數(shù)據(jù)是每天更新嗎?怎么有時過了兩天還沒有更新?
答:百度索引數(shù)據(jù)最快每天更新一次,最遲一周更新一次,不同站點的更新日期可能不同

問:索引量數(shù)據(jù)會保存多久?
答:您可以查詢到近一年中每天的索引量數(shù)據(jù),一年前的索引量數(shù)據(jù)為每月索引量數(shù)據(jù)

問:我僅驗證二級域名,是否可以查到主域的索引量數(shù)據(jù)?
答:不可以,必須驗證主域名和頂級域名



關(guān)于索引量,你必須知道的事網(wǎng)站被Baiduspider抓取收錄后,經(jīng)過一系列計劃才得以建入索引庫,有了和搜索用戶見面的機會。所以,索引量一直是站長們關(guān)注的焦點,但我們發(fā)現(xiàn),依然有很多站長對索引量存在誤讀。于是學(xué)院整理了一些常見問題,糾正一些錯誤的看法。

誤:站長可以通過site查詢站點收錄量
正:索引量數(shù)據(jù)以百度搜索資源平臺索引量工具為準(zhǔn),SITE僅為估值

誤:索引量增加了,流量就會多;索引量減少,流量危險
正:索引量分多個層級,進入上層索引庫才有更多與搜索用戶見面的機會;進入下層庫機會渺茫。所以,索引量總體的增加減少并不能說明流量會有什么變化

誤:站長應(yīng)該每天查看索引量數(shù)據(jù),發(fā)現(xiàn)不符合預(yù)期的變化就反饋
正:當(dāng)流量發(fā)生巨大變化時,索引量數(shù)據(jù)可以作為排查原因的渠道之一,其余時間沒有必要天天關(guān)注

誤:索引量只能增加不能減少
正:索引量上下浮動10%,甚至更多,都可能屬于正常。只要流量變化不大就不用緊張。


回復(fù)

使用道具 舉報

7#
 樓主| 發(fā)表于 2021-2-14 20:04:10 | 只看該作者
什么是關(guān)鍵詞影響力? (暫時在移動端上線)
關(guān)鍵詞影響力,是百度搜索資源平臺針對站點對于關(guān)鍵詞數(shù)據(jù)分析的需求,推出的全新概念。

站點關(guān)鍵詞影響力:在具體關(guān)鍵詞下,站點獲得的收益對應(yīng)的關(guān)鍵詞影響力;

最大關(guān)鍵詞影響力:在具體關(guān)鍵詞下,獲得收益最高的站點影響力;

整體關(guān)鍵詞影響力:在具體關(guān)鍵詞下,百度為全部站點帶來的全部收益產(chǎn)生的影響力總值;

關(guān)鍵詞影響力算法復(fù)雜,涵蓋該關(guān)鍵詞下百度搜索可以為站點帶來的全部收益指標(biāo),包括:排名、百度搜索流量、展現(xiàn)量等。


關(guān)鍵詞影響力三個數(shù)值如何分析?
通過查看自身站點關(guān)鍵詞影響力、最大關(guān)鍵詞影響力和全盤關(guān)鍵詞影響力,可以得到自身站點與行業(yè)標(biāo)桿之間的差距,自身站點在具體關(guān)鍵詞下的全盤占比,自身站點對具體關(guān)鍵詞的優(yōu)化上升空間及優(yōu)化性價比。

對站長SEO工作的收益和效果進行量化,對上升空間、行業(yè)差距,全盤情況及變化趨勢等信息一目了然。



搜索關(guān)鍵詞工具里出現(xiàn)的展現(xiàn)量、點擊量、點擊率、排名都是什么?
展現(xiàn)量:搜索用戶在百度搜索引擎查詢某關(guān)鍵詞時,看到您網(wǎng)站的次數(shù);

點擊量:僅統(tǒng)計從百度搜索結(jié)果頁點擊進入您網(wǎng)站的次數(shù);

點擊率:點擊量和展現(xiàn)量的比值,在一定程度上表征了網(wǎng)站的優(yōu)化空間,點擊率越小,網(wǎng)站的優(yōu)化空間越大;

排名:在熱門關(guān)鍵詞和熱門頁面列表中給出的排名是平均排名,表征在相應(yīng)時間段內(nèi),搜索用戶在查詢某關(guān)鍵詞時,落地頁在百度搜索結(jié)果頁的平均排名,是統(tǒng)計數(shù)據(jù)。


熱門關(guān)鍵詞和熱門頁面分別指什么?
熱門關(guān)鍵詞:用戶在百度搜索引擎中進行查詢時,您網(wǎng)站獲得流量(點擊量)較多的關(guān)鍵詞。工具最多可以提供5W個關(guān)鍵詞,默認(rèn)按點擊量降序排序。您可以通過熱門關(guān)鍵詞,查看用戶通過相應(yīng)的關(guān)鍵詞訪問了哪些頁面。   

熱門頁面:用戶在百度搜索引擎中進行查詢時,您網(wǎng)站中獲得流量(點擊量)較多的URL。工具最多可以提供5W個熱門頁面,默認(rèn)按點擊量降序排序。您可以通過熱門頁面,查看到達相應(yīng)頁面的關(guān)鍵詞。  


使用搜索關(guān)鍵詞工具能給您帶來什么?
搜索關(guān)鍵詞工具不僅能夠提供網(wǎng)站天級、周級及月度展現(xiàn)量、點擊量數(shù)據(jù),還能夠提供站點的熱門關(guān)鍵詞在百度搜索結(jié)果中的展現(xiàn)及點擊量數(shù)據(jù),及網(wǎng)站熱門關(guān)鍵詞在今天(有大約5小時的數(shù)據(jù)延遲)、昨天、最近7天、最近30天、30天內(nèi)自定義時間段等不同時間維度的展現(xiàn)量及點擊量數(shù)據(jù),最高可展現(xiàn)5W條關(guān)鍵詞數(shù)據(jù)。工具旨在全面幫助站長了解網(wǎng)站在百度搜索引擎中的表現(xiàn),決定頁面及網(wǎng)站的優(yōu)化方向,為網(wǎng)站運營決策提供分析依據(jù)。


回復(fù)

使用道具 舉報

8#
 樓主| 發(fā)表于 2021-2-14 20:04:30 | 只看該作者
什么是抓取異常  Baiduspider無法正常抓取,就是抓取異常。


抓取異常對網(wǎng)站有哪些影響  對于大量內(nèi)容無法正常抓取的網(wǎng)站,搜索引擎會認(rèn)為網(wǎng)站存在用戶體驗上的缺陷,并降低對網(wǎng)站的評價,在抓取、索引、權(quán)重上都會受到一定程度的負(fù)面影響,最終影響到網(wǎng)站從百度獲取的流量。


抓取異常的原因有哪些

一、網(wǎng)站異常

1、dns異常
  當(dāng)Baiduspider無法解析您網(wǎng)站的IP時,會出現(xiàn)DNS異常。可能是您的網(wǎng)站IP地址錯誤,或者域名服務(wù)商把Baiduspider封禁。請使用WHOIS或者host查詢自己網(wǎng)站IP地址是否正確且可解析,如果不正確或無法解析,請與域名注冊商聯(lián)系,更新您的IP地址。

2、連接超時
  抓取請求連接超時,可能原因服務(wù)器過載,網(wǎng)絡(luò)不穩(wěn)定

3、抓取超時
  抓取請求連接建立后,下載頁面速度過慢,導(dǎo)致超時,可能原因服務(wù)器過載,帶寬不足

4、連接錯誤
  無法連接或者連接建立后對方服務(wù)器拒絕

二、鏈接異常

1、訪問被拒絕
  爬蟲發(fā)起抓取,httpcode返回碼是403

2、找不到頁面
  爬蟲發(fā)起抓取,httpcode返回碼是404

3、服務(wù)器錯誤
  爬蟲發(fā)起抓取,httpcode返回碼是5XX

4、其他錯誤
  爬蟲發(fā)起抓取,httpcode返回碼是4XX,不包括403和404








回復(fù)

使用道具 舉報

9#
 樓主| 發(fā)表于 2021-2-14 20:04:50 | 只看該作者
什么是抓取診斷抓取診斷工具,可以讓站長從百度蜘蛛的視角查看抓取內(nèi)容,自助診斷百度蜘蛛看到的內(nèi)容,和預(yù)期是否一致。每個站點每周可使用70次,抓取結(jié)果只展現(xiàn)百度蜘蛛可見的前200KB內(nèi)容。


抓取診斷工具能做什么目前抓取診斷工具有如下作用:
1、診斷抓取內(nèi)容是否符合預(yù)期,譬如很多商品詳情頁面,價格信息是通過JavaScript輸出的,對百度蜘蛛不友好,價格信息較難在搜索中應(yīng)用。問題修正后,可用診斷工具再次抓取檢驗。


2、診斷網(wǎng)頁是否被加了黒鏈、隱藏文本。網(wǎng)站如果被黑,可能被加上隱藏的鏈接,這些鏈可能只在百度抓取時才出現(xiàn),需要用此抓取工具診斷。

3、檢查網(wǎng)站與百度的連接是否暢通,若是IP信息不一致,可以報錯通知百度更新IP。



抓取診斷工具常見錯誤類型解析
【url規(guī)范】
百度支持抓取的url長度不超過1024,如果您的鏈接長度過長,請在保證正常訪問的情況下,適當(dāng)精簡,保證鏈接能被百度正常抓取和收錄。

【重定向錯誤】
重定向是指百度spider訪問鏈接時發(fā)生了跳轉(zhuǎn),如果跳轉(zhuǎn)后的鏈接超長或者連續(xù)跳轉(zhuǎn)的次數(shù)超過5次,就會發(fā)生重定向錯誤而導(dǎo)致抓取失敗。

【服務(wù)器連接錯誤】
這種情況是指,由于服務(wù)器響應(yīng)過慢或您的網(wǎng)站屏蔽了百度spider,而導(dǎo)致百度無法訪問您的網(wǎng)站。從而會導(dǎo)致百度無法正常收錄或者更新您網(wǎng)站的內(nèi)容。您可能看到以下具體錯誤:連接超時、連接失敗、連接被拒、無響應(yīng)、響應(yīng)遭到截斷、連接重置、標(biāo)頭遭到截斷、超時。

*如何處理服務(wù)器連接錯誤?
減少動態(tài)網(wǎng)頁請求的過多網(wǎng)頁加載。如果網(wǎng)站為多個網(wǎng)址提供相同內(nèi)容,則會被視為動態(tài)提供內(nèi)容(例如,www.example.com/shoes.php?color=red&size=7www.example.com/shoes.php?size=7&color=red提供的內(nèi)容相同)。動態(tài)網(wǎng)頁的響應(yīng)時間可能會很長,并會因此導(dǎo)致超時問題。或者,服務(wù)器可能會返回超載狀態(tài),要求百度spider放慢抓取該網(wǎng)站的速度。一般來說,建議您盡量使用簡短的參數(shù)并謹(jǐn)慎使用。

確保您網(wǎng)站的托管服務(wù)器沒有停止運行、超載或配置不當(dāng)。如果連接問題、超時問題或響應(yīng)問題仍然存在,請與您的網(wǎng)站托管服務(wù)提供商聯(lián)系,并考慮增強您的網(wǎng)站處理流量的能力。

檢查網(wǎng)站是否不小心屏蔽了百度spider的IP。您可能會由于系統(tǒng)級問題而阻止了百度訪問,例如DNS配置問題、配置不當(dāng)?shù)姆阑饓駾oS防護系統(tǒng)、內(nèi)容管理系統(tǒng)配置問題。防御系統(tǒng)是保證托管服務(wù)正常運行的關(guān)鍵因素之一,并且這些系統(tǒng)通常會配置為自動阻止超量的服務(wù)器請求。由于百度spider發(fā)出的請求通常要比普通用戶多,因此可能會觸發(fā)這些防御系統(tǒng),導(dǎo)致它們阻止百度spider訪問并抓取您的網(wǎng)站。要解決此類問題,您需要確定網(wǎng)站基礎(chǔ)架構(gòu)中的哪個部分在阻止百度spider,然后取消該阻止。如果您沒有控制防火墻的權(quán)限,就需要與您的托管服務(wù)提供商聯(lián)系解決此問題。

【robots封禁問題】
在抓取診斷工具中如果返回的抓取失敗結(jié)論是robots封禁,請確認(rèn)您是否對該網(wǎng)址設(shè)置了robots,阻止百度spider抓取網(wǎng)站的某些內(nèi)容,如果您未使用robots文件屏蔽百度,請點擊旁邊的報錯鏈接,百度會立即更新您站點的robots信息;如果是您的誤操作導(dǎo)致了封禁,請及時修改robots文件,避免造成您的網(wǎng)站在百度收錄量和流量的下降。

【DNS問題】
DNS錯誤是指由于服務(wù)器停止運行或DNS到您網(wǎng)域的路由存在問題,導(dǎo)致百度spider無法與DNS服務(wù)器通信。

*如何處理DNS錯誤?
確保百度能夠抓取您的網(wǎng)站。對重要網(wǎng)頁(例如您的首頁)采用抓取診斷工具,如果它能順利返回您的首頁內(nèi)容,那么您就可以認(rèn)為百度能夠正常訪問您的網(wǎng)站。

對于持續(xù)的或反復(fù)出現(xiàn)的DNS錯誤,請與您的DNS提供商聯(lián)系。通常情況下,您的DNS提供商即為網(wǎng)站托管服務(wù)提供商。

配置您的服務(wù)器,使其能夠以404或500等HTTP錯誤代碼對不存在的主機名作出響應(yīng)。

【404錯誤】
一般情況下,當(dāng)百度spider訪問到不存在的網(wǎng)頁(因為您刪除或重命名了網(wǎng)頁且沒有將舊網(wǎng)址重定向到新網(wǎng)頁,或者鏈接中存在拼寫錯誤)時,就會出現(xiàn)“未找到”狀態(tài)錯誤(通常是404 HTTP狀態(tài)代碼)。

【訪問遭拒絕】
一般情況下,百度會通過跟蹤網(wǎng)頁間的鏈接來查找內(nèi)容。百度spider必須能夠訪問某個網(wǎng)頁才能抓取該網(wǎng)頁。如果您意外地看到了“訪問遭拒”錯誤,可能是由于以下幾種原因?qū)е碌模?br /> (1)百度spider無法訪問您網(wǎng)站上的網(wǎng)址,因為您網(wǎng)站上的所有或部分內(nèi)容要求用戶登錄后才能查看。
(2)您的服務(wù)器要求用戶使用代理進行身份驗證,或者您的托管服務(wù)提供商阻止百度spider訪問您的網(wǎng)站。

【參數(shù)錯誤】
由于請求的語法格式有誤,不符合服務(wù)器對請求的某些限制,或者請求本身存在一定的錯誤,服務(wù)器無法理解此請求,導(dǎo)致抓取失敗。

【socket讀寫錯誤】
當(dāng)百度spider訪問服務(wù)器,進行tcp通信的時候,socket讀寫發(fā)生異常,導(dǎo)致數(shù)據(jù)不能正常返回。請檢查服務(wù)器連接狀況和防火墻設(shè)置是否符合預(yù)期。

【讀取http頭或者頁面內(nèi)容時失敗】
您的服務(wù)器收到了我們的完整請求,但是返回信息時不完整,http頭或者響應(yīng)正文發(fā)生了截斷,導(dǎo)致網(wǎng)頁內(nèi)容不能正常讀取。


回復(fù)

使用道具 舉報

10#
 樓主| 發(fā)表于 2021-2-14 20:05:09 | 只看該作者
外鏈工具(該工具已下線)外鏈工具有何作用

1、結(jié)合談外鏈判斷對站點的問題外鏈進行處理,并對以后的鏈接建設(shè)起到積極的作用;
      2、基于我們提供的外鏈數(shù)據(jù),您可以進行多種維度的重組聚合,進而了解自身在外鏈建設(shè)上的情況以及與競爭對手的對比情況。



如何使用外鏈工具進行外鏈分析

此數(shù)據(jù)是未經(jīng)百度搜索計算過濾的原始數(shù)據(jù),僅供參考。登錄您在百度站長平臺注冊的賬號,進入站長工具à網(wǎng)站分析à外鏈分析,此時您可以:
      第一、查看一段時間內(nèi)您網(wǎng)站自身或某其他網(wǎng)站的外鏈趨勢走向;



第二、進一步可查看您網(wǎng)站自身的具體外鏈數(shù)據(jù)。當(dāng)您苦惱于曾經(jīng)在外鏈建設(shè)過程中某些外鏈影響到您網(wǎng)站在百度系統(tǒng)中的評價時,那么拒絕外鏈功能可以使您不再苦惱,同時支持單條拒絕和批量拒絕。其中,批量拒絕可分為四個級別進行批量操作:主域、站點、目錄、頁面,您可以按照需要進行操作,每次最高1000條。結(jié)合談外鏈判斷,對指向您網(wǎng)站的問題外鏈進行拒絕操作,當(dāng)問題外鏈提交至百度系統(tǒng)中并在一段時間的更新后,系統(tǒng)將根據(jù)情況自動調(diào)整對您網(wǎng)站的評價;


第三、如果您因疏忽而誤將重要外鏈提交拒絕,那么也不要過于擔(dān)心,可以通過撤銷拒絕來恢復(fù)。當(dāng)然,我們希望您不要過于粗心,系統(tǒng)難免出現(xiàn)問題將造成不必要的損失;

第四、您可以查看并下載任一網(wǎng)站的外鏈數(shù)據(jù),以便于您進行自身網(wǎng)站外鏈分析以及競爭對手對比分析。不同的聚合重組,將使您得到多種重要的結(jié)論。舉兩個例子:

(1)自身某專題頁排名不如競爭對手,當(dāng)其他方面相差不大的情況下懷疑是外鏈因素造成。此時就可以將兩個專題頁的外鏈進行聚合對比分析,找出差距,兼顧質(zhì)量和數(shù)量,著重分析外鏈產(chǎn)生的原因及過程。當(dāng)然,分析的數(shù)據(jù)前提是根據(jù)談外鏈判斷將問題外鏈排除之后的數(shù)據(jù),同時歡迎舉報。

(2)按anchor進行聚類,可分析某頁面?zhèn)鞑ミ^程中用戶以及其他網(wǎng)站對該內(nèi)容的定位,您在之后的外鏈建設(shè)傳播過程進行適度調(diào)整。
總之,詳細外鏈數(shù)據(jù)下載后根據(jù)自身需求可進行多方面的聚合分析,各位站長也可以在站長社區(qū)show出你的分析案例。




如何使用外鏈工具拒絕垃圾外鏈

第一,什么是拒絕外鏈?

外鏈?zhǔn)前俣扰袛嗑W(wǎng)頁重要性數(shù)百個因素中很重要的一個方面。百度盡可能避免第三方網(wǎng)站上的行為對您網(wǎng)站產(chǎn)生負(fù)面影響。但某些情況下,一些垃圾、低質(zhì)量導(dǎo)入鏈接可能會影響百度對您網(wǎng)站的評價。例如,網(wǎng)絡(luò)上大量的垃圾內(nèi)容或質(zhì)量很差的鏈接或者您購買了付費鏈接、采用了違反百度站長指南的鏈接手段。

首先,我們建議您從鏈接來源頁面盡可能多的刪除垃圾內(nèi)容和鏈接。

其次,再沒有任何其他措施可以刪除剩余垃圾鏈接的情況下,就可以利用拒絕外鏈工具來通知百度在評價您網(wǎng)頁之時忽略掉該鏈接。

第二,拒絕外鏈應(yīng)該注意什么?

當(dāng)您發(fā)現(xiàn)指向您網(wǎng)站的垃圾鏈接、虛假或低質(zhì)量鏈接數(shù)量可觀,同時確定這些鏈接會給您的網(wǎng)站造成負(fù)面影響,再使用該工具,否則請勿使用。當(dāng)您確認(rèn)拒絕后將無法撤銷或刪除,請謹(jǐn)慎使用。

如果您存在購買鏈接、群發(fā)外鏈、掛黑鏈等試圖操作搜索引擎排序的作弊行為,我們不能保證短時間內(nèi)去除掉該垃圾外鏈對您網(wǎng)站的負(fù)面影響,這需要數(shù)周乃至更長的時間來驗證,請您耐心等待。


第三,如何使用拒絕外鏈工具?
        請先選擇您希望拒絕的外鏈類別,類別主要分為主域、站點、目錄和頁面。主域是指在域名服務(wù)商注冊的域名,如:example.com;站點是指網(wǎng)站的根目錄之前的url,網(wǎng)站地址,如:www.example.com/;目錄是指站點后以“/”結(jié)尾的,如:www.example.com/a/;頁面是指一個具體頁面的url,如:www.example.com/a/978.html
  以url:www.iqiyi.com/fun/20130308/4319a1351bb0167d.html為例,該url即為一個頁面;主域為iqiyi.com;站點為www.iqiyi.comwww.iqiyi.com/fun/為一個目錄。
  根據(jù)您選擇的類別填寫相對應(yīng)的url提交拒絕信息即可。我們需要一定的時間來處理您提交的信息,拒絕外鏈生效的周期為數(shù)周,請您耐心等待。



外鏈工具常見問題問:拒絕外鏈多長時間生效?
答:拒絕外鏈沒有固定生效的周期,時間長達數(shù)周,請您耐心等待。
問:拒絕后的外鏈?zhǔn)欠窨梢曰謴?fù)?
答:不可以。當(dāng)您確認(rèn)拒絕后將無法撤銷或刪除,請謹(jǐn)慎使用







回復(fù)

使用道具 舉報

11#
 樓主| 發(fā)表于 2021-2-14 20:05:31 | 只看該作者
什么是抓取頻次  抓取頻次是搜索引擎在單位時間內(nèi)(天級)對網(wǎng)站服務(wù)器抓取的總次數(shù),如果搜索引擎對站點的抓取頻次過高,很有可能造成服務(wù)器不穩(wěn)定,Baiduspider會根據(jù)網(wǎng)站內(nèi)容更新頻率和服務(wù)器壓力等因素自動調(diào)整抓取頻次。


什么情況下可以進行抓取頻次上限調(diào)整

首先,Baiduspider會根據(jù)網(wǎng)站服務(wù)器壓力自動進行抓取頻次調(diào)整。其次,如果Baiduspider的抓取影響了網(wǎng)站穩(wěn)定性,站長可以通過此工具調(diào)節(jié)Baiduspider每天抓取您網(wǎng)站的頻次上限。
  強調(diào)1:調(diào)整抓取頻次上限不等于調(diào)高抓取頻次。強調(diào)2:建議您慎重調(diào)節(jié)抓取頻次上限值,如果抓取頻次過小則會影響B(tài)aiduspider對網(wǎng)站的收錄。








回復(fù)

使用道具 舉報

12#
 樓主| 發(fā)表于 2021-2-14 20:05:57 | 只看該作者
什么是robots文件

Robots是站點與spider溝通的重要渠道,站點通過robots文件聲明本網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。

搜索引擎使用spider程序自動訪問互聯(lián)網(wǎng)上的網(wǎng)頁并獲取網(wǎng)頁信息。spider在訪問一個網(wǎng)站時,會首先會檢查該網(wǎng)站的根域下是否有一個叫做 robots.txt的純文本文件,這個文件用于指定spider在您網(wǎng)站上的抓取范圍。您可以在您的網(wǎng)站中創(chuàng)建一個robots.txt,在文件中聲明 該網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。

請注意,僅當(dāng)您的網(wǎng)站包含不希望被搜索引擎收錄的內(nèi)容時,才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容,請勿建立robots.txt文件。


robots.txt文件放在哪里?

robots.txt文件應(yīng)該放置在網(wǎng)站根目錄下。舉例來說,當(dāng)spider訪問一個網(wǎng)站(比如 http://www.abc.com)時,首先會檢查該網(wǎng)站中是否存在http://www.abc.com/robots.txt這個文件,如果 Spider找到這個文件,它就會根據(jù)這個文件的內(nèi)容,來確定它訪問權(quán)限的范圍。

網(wǎng)站 URL

相應(yīng)的 robots.txt URL

http://www.w3.org/

http://www.w3.org/robots.txt

http://www.w3.org:80/

http://www.w3.org:80/robots.txt

http://www.w3.org:1234/

http://www.w3.org:1234/robots.txt

http://w3.org/

http://w3.org/robots.txt



robots.txt文件的格式

robots文件往往放置于根目錄下,包含一條或更多的記錄,這些記錄通過空行分開(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示:
        "<field>:<optional space><value><optionalspace>"

在該文件中可以使用#進行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow和Allow行,詳細情況如下:
        User-agent:該項的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多條User-agent記錄說明有多個robot會受到"robots.txt"的限制,對該文件來說,至少要有一條User-agent記錄。如果該項的值設(shè)為*,則對任何robot均有效,在"robots.txt"文件中,"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

        Disallow:該項的值用于描述不希望被訪問的一組URL,這個值可以是一條完整的路徑,也可以是路徑的非空前綴,以Disallow項的值開頭的URL不會被 robot訪問。例如"Disallow:/help"禁止robot訪問/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"則允許robot訪問/help.html、/helpabc.html,不能訪問/help/index.html。"Disallow:"說明允許robot訪問該網(wǎng)站的所有url,在"/robots.txt"文件中,至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件,則對于所有的搜索引擎robot,該網(wǎng)站都是開放的。

        Allow:
該項的值用于描述希望被訪問的一組URL,與Disallow項相似,這個值可以是一條完整的路徑,也可以是路徑的前綴,以Allow項的值開頭的URL 是允許robot訪問的。例如"Allow:/hibaidu"允許robot訪問/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一個網(wǎng)站的所有URL默認(rèn)是Allow的,所以Allow通常與Disallow搭配使用,實現(xiàn)允許訪問一部分網(wǎng)頁同時禁止訪問其它所有URL的功能。

        使用"*"and"$":
Baiduspider支持使用通配符"*"和"$"來模糊匹配url。
        "*" 匹配0或多個任意字符
         "$" 匹配行結(jié)束符。

最后需要說明的是:百度會嚴(yán)格遵守robots的相關(guān)協(xié)議,請注意區(qū)分您不想被抓取或收錄的目錄的大小寫,百度會對robots中所寫的文件和您不想被抓取和收錄的目錄做精確匹配,否則robots協(xié)議無法生效。



robots.txt文件用法舉例


網(wǎng)站誤封Robots該如何處理

robots文件是搜索生態(tài)中很重要的一個環(huán)節(jié),同時也是一個很細節(jié)的環(huán)節(jié)。很多站長同學(xué)在網(wǎng)站運營過程中,很容易忽視robots文件的存在,進行錯誤覆蓋或者全部封禁robots,造成不必要損失!

那么如果誤操作封禁了robots怎么辦?今天我們請到了廈門258網(wǎng)站運營負(fù)責(zé)人——鄭軍偉,為我們分享網(wǎng)站robots誤封禁后該如何操作?

【案例背景】

網(wǎng)站開發(fā)2.0版本,技術(shù)選擇了在線開發(fā),為了避免搜索引擎抓取開發(fā)版本,要求技術(shù)人員設(shè)置了Robots封禁處理。2.0版本開發(fā)周期1個月,1個月后網(wǎng)站版本迭代,直接覆蓋了1.0版本,包括Robots封禁文件,2天后發(fā)現(xiàn)流量大幅下降,檢查收錄發(fā)現(xiàn)800萬收錄降至0條,關(guān)鍵詞大量掉線。

【處理方式】

1.修改Robots封禁為允許,然后到百度搜索資源后臺檢測并更新Robots。

2.在百度搜索資源后臺抓取檢測,此時顯示抓取失敗,沒關(guān)系,多點擊抓取幾次,觸發(fā)蜘蛛抓取站點。

3.在百度搜索資源后臺抓取頻次,申請抓取頻次上調(diào)。

4.百度反饋中心,反饋是因為誤操作導(dǎo)致了這種情況的發(fā)生。

5.百度搜索資源后臺鏈接提交處,設(shè)置數(shù)據(jù)API推送(實時)。

6.更新sitemap網(wǎng)站地圖,重新提交百度,每天手動提交一次。

以上處理完,接下來就是等待了,萬幸,2天的時間數(shù)據(jù)開始慢慢回升,到第3天基本回升到正常狀態(tài)!

【案例總結(jié)】

本次事故絕對是運營生涯的一次敗筆,總結(jié)反思一下,希望大家避免類似問題。

1.產(chǎn)品開發(fā)一定要避免在線開發(fā),不能為了省事不搭建開發(fā)環(huán)境。

2.產(chǎn)品迭代要有流程記錄,開發(fā)時做了那些設(shè)置處理,那些是不需要放出來的,那些是必須放出來的,要非常清楚。

3.要經(jīng)常關(guān)注百度搜索資源后臺,關(guān)注相關(guān)數(shù)據(jù)變化,從數(shù)據(jù)變化中及時發(fā)現(xiàn)問題


百度搜索robots協(xié)議全新升級

9月11日,百度搜索robots全新升級。升級后robots將優(yōu)化對網(wǎng)站視頻URL收錄抓取情況。僅當(dāng)您的網(wǎng)站包含不希望被視頻搜索引擎收錄的內(nèi)容時,才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容,請勿建立robots.txt文件。

如您的網(wǎng)站未設(shè)置robots協(xié)議,百度搜索對網(wǎng)站視頻URL的收錄將包含視頻播放頁URL,及頁面中的視頻文件、視頻周邊文本等信息,搜索對已收錄的短視頻資源將對用戶呈現(xiàn)為視頻極速體驗頁。此外,綜藝影視類長視頻,搜索引擎僅收錄頁面URL。

詳情見:視頻極速體驗解決方案





回復(fù)

使用道具 舉報

13#
 樓主| 發(fā)表于 2021-2-14 20:06:20 | 只看該作者
安全檢測(該工具已下線)安全檢測工具用語說明
  • 掛馬:指網(wǎng)站被黑客通過入侵手段拿到修改頁面的權(quán)限,在網(wǎng)頁的源代碼中插入網(wǎng)頁木馬(惡意代碼),用戶在訪問網(wǎng)頁時就會運行網(wǎng)頁木馬受到漏洞攻擊,從而自動下載并執(zhí)行病毒木馬程序。網(wǎng)站被掛馬會導(dǎo)致訪問網(wǎng)站的用戶電腦感染病毒木馬,可能會遭受遠程控制、泄露文檔資料、賬戶密碼等信息,危害極大。網(wǎng)站在被其他人發(fā)現(xiàn)存在掛馬后,搜索引擎、殺毒軟件、瀏覽器等會進行攔截用戶訪問,直接導(dǎo)致網(wǎng)站不可訪問,流失大量用戶。
  • 釣魚:指頁面仿冒某知名網(wǎng)站,讓用戶以為是正規(guī)網(wǎng)站,給用戶造成損失。
  • 欺詐:頁面中存在欺騙用戶、虛假的內(nèi)容。
  • 違規(guī)內(nèi)容:內(nèi)容存在違法信息,或者出于違法的灰色地帶。


被黑修復(fù)建議
  • 掛馬:要完全解決網(wǎng)站被掛馬的問題,不僅要查出被惡意代碼感染的網(wǎng)頁,還需要修復(fù)網(wǎng)站漏洞,阻止黑客再次掛馬的可能性。通常情況下,網(wǎng)站被掛馬說明黑客已經(jīng)入侵成功并且取得修改網(wǎng)頁的權(quán)限,才可以在網(wǎng)頁里插入惡意代碼,因此首要解決被入侵的根源,通過使用Web漏洞掃描器或者分析網(wǎng)站訪問歷史日志,找到黑客攻擊的網(wǎng)站漏洞,對漏洞進行修補,并且及時查找、清除黑客留下的后門程序。
  • 釣魚、欺詐、違規(guī)內(nèi)容:請確認(rèn)您的網(wǎng)站是否存在釣魚、欺詐、違規(guī)內(nèi)容的情況,如果不存在可能是被黑,請排查自己的網(wǎng)站的內(nèi)容質(zhì)量。



如何防止網(wǎng)站被黑為避免您的網(wǎng)站被黑客攻擊,您需要在平時做大量的工作,例如
1、定期檢查服務(wù)器日志,檢查是否有可疑的針對非前臺頁面的訪問。
2、經(jīng)常檢查網(wǎng)站文件是否有不正常的修改或者增加。
3、關(guān)注操作系統(tǒng),以及所使用程序的官方網(wǎng)站。如果有安全更新補丁出現(xiàn),應(yīng)立即部署,不使用官方已不再積極維護的版本,如果條件允許,建議直接更新至最新版;關(guān)注建站程序方發(fā)布的的安全設(shè)置準(zhǔn)則。
4、系統(tǒng)漏洞可能出自第三方應(yīng)用程序,如果網(wǎng)站使用了這些應(yīng)用程序,建議仔細評估其安全性。
5、修改開源程序關(guān)鍵文件的默認(rèn)文件名,黑客通常通過自動掃描某些特定文件是否存在的方式來判斷是否使用了某套程序。
6、修改默認(rèn)管理員用戶名,提高管理后臺的密碼強度,使用字母、數(shù)字以及特殊符號多種組合的密碼,并嚴(yán)格控制不同級別用戶的訪問權(quán)限。
7、選擇有實力保障的主機服務(wù)提供商。
8、關(guān)閉不必要的服務(wù),以及端口。
9、關(guān)閉或者限制不必要的上傳功能。
10、設(shè)置防火墻等安全措施。
11、若被黑問題反復(fù)出現(xiàn),建議重新安裝服務(wù)器操作系統(tǒng),并重新上傳備份的網(wǎng)站文件。
12、對于缺乏專業(yè)維護人員的網(wǎng)站,建議向?qū)I(yè)安全公司咨詢。











回復(fù)

使用道具 舉報

14#
 樓主| 發(fā)表于 2021-2-14 20:06:59 | 只看該作者
什么是反饋中心
反饋中心是百度搜索資源平臺開放給站長的溝通反饋渠道,站長管理的站點在百度網(wǎng)頁搜索、移動搜索、新聞搜索中遇到問題,或是在使用百度搜索資源平臺工具時遇到問題,可以通過反饋中心提交反饋。


如何使用反饋中心當(dāng)站點遇到問題時,首先請通過搜索資源平臺工具學(xué)院文章,對網(wǎng)站進行自查。
若自查后無法解決,請在反饋中心選擇遇到問題的站點,之后選擇產(chǎn)品分類,即網(wǎng)站是在網(wǎng)頁搜索、移動搜索、新聞搜索或站長工具使用中遇到問題。然后選擇對應(yīng)的問題分類,最后根據(jù)頁面提示,進行詳細描述。您對問題的描述越清晰,越有助于我們快速地定位和解決問題。
建議同樣的問題不要重復(fù)投訴。

站長關(guān)心的熱門問題

logo提交后為何沒有展現(xiàn)?
  答:您好,logo展現(xiàn)目前只針對優(yōu)質(zhì)站點進行審核和展現(xiàn),如果您站為優(yōu)質(zhì)站點,logo提交后通常會在1到2周內(nèi)進行審核和展現(xiàn),具體情況請參考百度站長社區(qū)的詳情帖

  新建的網(wǎng)站未收錄怎么辦?
  答:頁面是否被收錄,與頁面是否具有價值有關(guān),原則上內(nèi)容越貼近用戶的搜索需要,網(wǎng)頁就會越快地被搜索引擎收錄。但通常情況下頁面從產(chǎn)生到收錄需要一定周期,時間從幾分鐘到幾天不等,這取決于網(wǎng)頁的搜索價值和重要性的高低。長時間不收錄的原因可能包括:
  1) 頁面被懲罰整站或目錄沒有進行收錄,
  2) 網(wǎng)頁沒有被搜索引擎發(fā)現(xiàn),因為網(wǎng)頁沒有放置外部鏈接,本身是個孤島頁面。
  針對第一種情況,首先請查看網(wǎng)站是否出現(xiàn)過無法打開或連通異常的狀況,可以接助站長平臺抓取診斷工具來進行判斷。同時查看網(wǎng)站是否有過不良信息的收錄,如果網(wǎng)站已經(jīng)恢復(fù)正常并可以正常連通和抓取,可以提交到反饋中心進行反饋。針對網(wǎng)站始終沒有被百度抓取的情況,建議您使用搜索資源平臺的普通收錄工具進行提交。

  網(wǎng)站在搜索url或使用domain語法搜索時,出現(xiàn)了不相關(guān)的結(jié)果的問題?

  答:通常情況下,搜索url是為了確定該頁面是否已被搜索引擎收錄,除此以外的其他自然結(jié)果,均為以該url作為關(guān)鍵詞,在網(wǎng)頁庫中進行搜索而得出的自然結(jié)果。這些自然結(jié)果的內(nèi)容如何,與網(wǎng)頁所處的網(wǎng)站是否存在問題并無關(guān)聯(lián)。



回復(fù)

使用道具 舉報

15#
 樓主| 發(fā)表于 2021-2-14 20:07:15 | 只看該作者
站點子鏈站點子鏈提交工具,鼓勵網(wǎng)站管理員將網(wǎng)站內(nèi)優(yōu)質(zhì)子鏈提交給百度,這些信息能在百度搜索結(jié)果中以“站點子鏈”的形式展現(xiàn),提升網(wǎng)站的權(quán)威性,幫助用戶瀏覽您的網(wǎng)站,提升網(wǎng)站的流量和用戶體驗。


使用說明1、若主鏈為主站,推薦添加重要的子站點作為子鏈數(shù)據(jù);若主鏈為子站點,推薦添加重要頻道頁作為子鏈數(shù)據(jù);
2、百度只支持2條、4條、6條子鏈接的展現(xiàn)樣式;對已提交的子鏈您可以進行標(biāo)題、摘要的修改操作;
3、當(dāng)您判斷已展現(xiàn)的子鏈不符合要求時,可以執(zhí)行刪除操作,刪除生效后下方數(shù)據(jù)列表會同步刪除;
4、百度會將您提交的數(shù)據(jù)仔細評估并作為重要的參考依據(jù),但不保證一定會采納。
5、對于已生效的數(shù)據(jù),百度會根據(jù)搜索用戶當(dāng)前需求進行展現(xiàn),不保證會全部展現(xiàn)。
6、您可以根據(jù)重要程度對子鏈進行排序,百度會根據(jù)您設(shè)定的排序綜合評估確定最終的展現(xiàn)順序。







回復(fù)

使用道具 舉報

16#
 樓主| 發(fā)表于 2021-2-14 20:07:33 | 只看該作者
什么是閉站保護

由網(wǎng)站自身原因(改版、暫停服務(wù)等)、客觀原因(服務(wù)器故障、政策影響等)造成的網(wǎng)站較長一段時間都無法正常訪問,百度搜索引擎會認(rèn)為該站屬于關(guān)閉狀態(tài)。站長可以通過閉站保護工具進行提交申請,申請通過后,百度搜索引擎會暫時保留索引、暫停抓取站點、暫停其在搜索結(jié)果中的展現(xiàn)。待網(wǎng)站恢復(fù)正常后,站長可通過閉站保護工具申請恢復(fù),申請審核通過后,百度搜索引擎會恢復(fù)對站點的抓取和展現(xiàn),站點的評價得分不會受到影響。

閉站保護注意事項

1)站長關(guān)閉站點后應(yīng)立即申請閉站保護,若申請不及時,站點很可能被判為死鏈,影響后續(xù)的收錄和展現(xiàn)。
2)支持兩種閉站方法,全站HTTP狀態(tài)碼設(shè)置為404或者切斷電源關(guān)閉服務(wù)器,不支持使用DNS方法閉站,noip不會通過閉站申請校驗。
3)申請閉站保護,若通過審核將在一天內(nèi)生效;申請取消閉站保護,若通過審核將在2天以內(nèi)生效。
4)閉站保護期最長為180天,超過180天將自動取消閉站保護。
5)使用閉站工具只能保留您網(wǎng)站的索引量,但不保證網(wǎng)站的排名不變
6) 閉站保護期間,為了滿足用戶的尋址需求,首頁會被豁免,不予屏蔽                       


回復(fù)

使用道具 舉報

17#
 樓主| 發(fā)表于 2021-2-14 20:08:10 | 只看該作者
什么是內(nèi)鏈死鏈、鏈出死鏈、鏈入死鏈

假設(shè)您的網(wǎng)站是www.abc.com,第三方網(wǎng)站是www.example.com

內(nèi)鏈死鏈:在您網(wǎng)站上發(fā)現(xiàn)同一個域名內(nèi)的死鏈,即:如果在http://www.abc.com/1.html上發(fā)現(xiàn)了一條死鏈http://www.abc.com/2.html,那么我們稱http://www.abc.com/2.html為內(nèi)鏈死鏈;
       鏈出死鏈:在您網(wǎng)站上發(fā)現(xiàn)的鏈接到其他網(wǎng)站的死鏈,即:如果在http://www.abc.com/1.html上發(fā)現(xiàn)了一條死鏈http://www.example.com/1.html,那么我們稱http://www.example.com/1.html為外鏈死鏈;
       鏈入死鏈:在其他網(wǎng)站上發(fā)現(xiàn)的鏈接到您網(wǎng)站的死鏈,即:如果在http://www.example.com/2.html上發(fā)現(xiàn)了死鏈http://www.abc.com/2.html,那么我們稱http://www.abc.com/2.html為鏈入死鏈。


死鏈?zhǔn)纠故局校梨滄溄印⑺梨溓版湣㈠^文本、發(fā)現(xiàn)時間分別代表什么含義

死鏈鏈接:Baiduspider在嘗試抓取該網(wǎng)頁時,該網(wǎng)頁返回了404代碼; 目前死鏈鏈接只針對協(xié)議死鏈,后續(xù)會陸續(xù)增加跳轉(zhuǎn)死鏈和內(nèi)容死鏈。

死鏈前鏈:從該網(wǎng)頁經(jīng)過一次點擊即可到達當(dāng)前死鏈鏈接,稱該網(wǎng)頁為當(dāng)前死鏈鏈接的前鏈,即死鏈前鏈。

錨文本:在死鏈前鏈這個網(wǎng)頁上發(fā)現(xiàn)的對應(yīng)該死鏈鏈接的文本信息。

發(fā)現(xiàn)時間:Baiduspider最近一次抓取該死鏈鏈接的時間。


外鏈工具有何作用

1、結(jié)合《談外鏈判斷》對站點的問題外鏈進行處理,并對以后的鏈接建設(shè)起到積極的作用;

2、基于我們提供的外鏈數(shù)據(jù),您可以進行多種維度的重組聚合,進而了解自身在外鏈建設(shè)上的情況。


如何使用外鏈工具進行外鏈分析

此數(shù)據(jù)是未經(jīng)百度搜索計算過濾的原始數(shù)據(jù),僅供參考。登錄您在百度站長平臺注冊的賬號,進入站長工具->優(yōu)化與維護->鏈接分析,此時您可以:

第一、查看一段時間內(nèi)您網(wǎng)站自身的外鏈趨勢走向;  

第二、進一步可查看鏈接到您網(wǎng)站的外鏈所在的主域以及外鏈數(shù)量。

第三、您可以查看并下載您網(wǎng)站的具體外鏈數(shù)據(jù),以便于您進行自身網(wǎng)站外鏈分析。不同的聚合重組,將使您得到多種重要的結(jié)論。舉兩個例子:

(1)自身某專題頁排名不高,當(dāng)其他方面找不到原因的時候懷疑是外鏈因素造成。此時就可以將專題頁的外鏈進行聚合分析,兼顧質(zhì)量和數(shù)量,著重分析外鏈產(chǎn)生的原因及過程。當(dāng)然,分析的數(shù)據(jù)前提是根據(jù)談外鏈判斷將問題外鏈排除之后的數(shù)據(jù),同時歡迎舉報。

(2)按anchor進行聚類,可分析某頁面?zhèn)鞑ミ^程中用戶以及其他網(wǎng)站對該內(nèi)容的定位,您在之后的外鏈建設(shè)傳播過程進行適度調(diào)整。

總之,詳細外鏈數(shù)據(jù)下載后根據(jù)自身需求可進行多方面的聚合分析。


外鏈工具常見問題

問:外鏈多長時間更新?
      答:目前預(yù)計一周更新一次,請您耐心等待。


回復(fù)

使用道具 舉報

18#
 樓主| 發(fā)表于 2021-2-14 20:08:31 | 只看該作者
什么是移動適配,移動適配工具的作用

提升搜索用戶在百度移動搜索的檢索體驗,會給對應(yīng)PC頁面的手機頁面在搜索結(jié)果處有更多的展現(xiàn)機會,需要站點向百度提交主體內(nèi)容相同的PC頁面與移動頁面的對應(yīng)關(guān)系,即為移動適配。為此,百度移動搜索提供“移動適配”服務(wù),如果您同時擁有PC站和手機站,且二者能夠在內(nèi)容上對應(yīng),即主體內(nèi)容完全相同,您可以通過移動適配工具進行對應(yīng)關(guān)系提交。


站長通過移動適配工具提交pattern級別或者url級別的PC頁與手機頁對應(yīng)關(guān)系,若可以成功通過校驗,將有助于百度移動搜索將移動用戶直接送入對應(yīng)的手機頁結(jié)果。積極參與“移動適配”,將有助于您的手機站在百度移動搜索獲得更多流量,同時以更佳的瀏覽效果贏取用戶口碑。

移動適配工具如何使用

當(dāng)您同時擁有移動站點和PC站點、且移動頁面和PC頁面的主體內(nèi)容完全相同,就可以在通過百度搜索資源平臺提交正確的適配關(guān)系,獲取更多移動流量。


第一步,注冊并登錄百度搜索資源平臺

第二步,提交PC網(wǎng)站并驗證站點與ID的歸屬關(guān)系,具體驗證網(wǎng)站歸屬方法可見幫助文檔

第三步,站點驗證后,進入“搜索服務(wù)”——“資源提交”——“移動適配”,選擇具體需要進行移動適配的PC站,然后“添加適配關(guān)系”

第四步,根據(jù)自己提交的適配數(shù)據(jù)特點,選擇適合您的提交方式:

目前移動適配工具支持規(guī)則適配提交URL適配提交,無論您使用哪種方式都需要先指定PC與移動站點,此舉可以令平臺更加快速地檢驗?zāi)峤坏臄?shù)據(jù)、給出反饋,順利生效。同時您在之后步驟中提交的適配數(shù)據(jù)中必須包含指定的站點,否則會導(dǎo)致校驗失敗。

1)規(guī)則適配:當(dāng)pc地址和移動地址存在規(guī)則(pattern)的匹配關(guān)系時(如PC頁面www.xxx.com/picture/12345.html,移動頁面m.xxx.com/picture/12345.html),可以使用規(guī)則適配,添加pc和移動的正則表達式,正則的書寫方式詳見《正則格式說明》我們強烈建議您使用規(guī)則適配,一次提交成功生效后,對于新增同規(guī)則的URL可持續(xù)生效,不必再進行多次提交。同時該方式處理周期相對URL適配更短,且易于維護和問題排查,是百度推薦使用的提交方式。

2)URL適配:當(dāng)規(guī)則適配不能滿足適配關(guān)系的表達時,您可以通過“URL對文件上傳”功能,將主體內(nèi)容相同的pc鏈接和移動鏈接提交給百度:文件格式為每行前后兩個url,分別是pc鏈接和移動鏈接,中間用空格分隔,一個文件最多可以提交5萬對url,您可以提交多個文件。另外您還可以選擇“URL對批量提交”,在輸入框中直接輸入url對,格式與文件相同,但此處一次性僅限提交2000對url。

第五步,提交適配數(shù)據(jù)后,關(guān)注移動適配工具會提供狀態(tài)說明,若未適配成功,可根據(jù)說明文字和示例進行相應(yīng)的調(diào)整后更新提交適配數(shù)據(jù)。


移動適配目錄如何使用工具提交適配關(guān)系

PC站點下開辟某個目錄存放移動適配頁面、作為移動適配“站”時,依然會有提交移動適配數(shù)據(jù)的需求,如:http://www.a.com/a.html 適配到http://www.a.com/m/a.html。雖然從長遠角度看,這種行為對搜索引擎極不友好,百度(包括GOOGLE)一直不贊成不鼓勵這種建方式。但為了滿足該需求,百度搜索資源平臺移動適配工具依然提供滿足此需求的功能。

您可以先在下拉菜單中選擇準(zhǔn)確的站點域名,再點擊“+添加適配關(guān)系”。也可以在默認(rèn)的www主域下“+添加適配關(guān)系”。

進入“添加新數(shù)據(jù)”界面后,“指定PC-移動站點”處填寫的移動站點名,要與PC站點名一致,然后在提交規(guī)則處填寫相應(yīng)的正則信息,然后增加校驗用url對即可。提交數(shù)據(jù)時示例圖如下:


移動適配狀態(tài)說明

校驗中:百度搜索資源平臺會對管理員提交的移動適配數(shù)據(jù)進行校驗,當(dāng)認(rèn)為實際情況與您提交的情況相符時,才會對適配數(shù)據(jù)進行生效處理,這個校驗時間大約為10天。目前“校驗中”的適配數(shù)據(jù)不能刪除。

校驗失敗:當(dāng)百度搜索資源平臺發(fā)現(xiàn)站點存在如下問題時,會判為校驗失敗,不會進行后續(xù)的生效處理:

 a、頁面不相似:PC鏈接和移動鏈接的主體內(nèi)容相似度低,達不到對應(yīng)關(guān)系。請檢查網(wǎng)站頁面,確認(rèn)主體內(nèi)容一致后再次提交

    b、移動頁不友好: 您提交的適配數(shù)據(jù)中移動鏈接為pc頁或移動頁面不符合廣告白皮書規(guī)范,請自查確保數(shù)據(jù)無問題后再次提交

 c、含有死鏈鏈接:您提交的適配數(shù)據(jù)中含有死鏈內(nèi)容,請自查適配數(shù)據(jù),保證無死鏈情況后再提交

 d、未達到校驗標(biāo)準(zhǔn):提交面的“?”號獲取的適配數(shù)據(jù)中,PC頁面或移動頁面沒有收錄。移動適配工具對適配數(shù)據(jù)進行正確性校驗時依賴PC網(wǎng)頁庫和移動網(wǎng)頁庫中已收錄的頁面,如果校驗時取到的PC頁或移動頁百度還未收錄,將無法對適配數(shù)據(jù)進行檢驗。對于未收錄的頁面將推送給spider進行抓取,若收錄后可進行下一次正確性檢驗,管理員不必再另行提交。

 e、未達到校驗標(biāo)準(zhǔn):PC頁面或移動頁面沒有收錄。移動適配工具對適配數(shù)據(jù)進行正確性校驗時依賴PC網(wǎng)頁庫和移動網(wǎng)頁庫中已收錄的頁面,如果校驗時取到的PC頁或移動頁百度還未收錄,將無法對適配數(shù)據(jù)進行檢驗。對于未收錄的頁面將推送給spider進行抓取,若收錄后可進行下一次正確性檢驗,管理員不必再另行提交。*頁面被收錄不等于被建索引,收錄了的頁面有可能在索引量工具里查不到。

    f、數(shù)據(jù)校驗失敗:數(shù)據(jù)流校驗異常,請站點再次提交數(shù)據(jù),進行二次校驗、

    g、其他原因:可能由于以下原因?qū)е逻m配數(shù)據(jù)校驗失敗:1、pc移動頁面不對應(yīng);2、pc頁面展示量太低;3、正則規(guī)則錯誤;請網(wǎng)站自查是否有以上情況,如有以上情況請自查并整改,然后再次提交數(shù)據(jù)


以上錯誤信息會抽樣展示在錯誤詳情頁面中,您可以通過點擊狀態(tài)說明獲取

校驗成功:您提交的適配數(shù)據(jù)通過校驗后,百度搜索資源平臺會進行生效處理,這個過程最長為10天。

校驗部分成功: 您提交的適配數(shù)據(jù)中包含部分校驗失敗內(nèi)容,失敗部分可以參考校驗失敗的說明,其他成功部分會上線生效。

未達到校驗標(biāo)準(zhǔn):您提交的規(guī)則所涉及的頁面,絕大多數(shù)未收錄(區(qū)別于索引)或展現(xiàn)過少,平臺工具為了高效處理海量規(guī)則,會將未達到校驗標(biāo)準(zhǔn)的規(guī)則做延后處理,站點方面不必再做額外工作。

適配成功:百度已經(jīng)根據(jù)您提交的適配數(shù)據(jù)對移動鏈接進行了替換。

適配部分成功:對應(yīng)校驗部分成功而言,那部分通過校驗的數(shù)據(jù)已完成移動適配。

內(nèi)容重復(fù):此文件提交的數(shù)據(jù)被后提交的文件包含覆蓋,工具后續(xù)不會再對該文件進行處理,也不會反饋處理狀態(tài)

移動關(guān)系發(fā)生變化如何修改

站長通過移動適配工具提供適配數(shù)據(jù)中若發(fā)現(xiàn)數(shù)據(jù)有誤,或想更新舊的、已生效的適配關(guān)系,可以重新提交新的適配數(shù)據(jù)予以覆蓋。具體如下:

1、目前“校驗中”的數(shù)據(jù)不支持直接刪除,若此時需要修改適配關(guān)系數(shù)據(jù),不需要等等該數(shù)據(jù)更新狀態(tài),可以直接提交新的適配關(guān)系予以覆蓋。

2、如適配數(shù)據(jù)發(fā)生校驗失敗,無需將其刪除,直接提交新的適配關(guān)系覆蓋即可。

3、若需要修改已適配成功的關(guān)系數(shù)據(jù),無需將原適配數(shù)據(jù)刪除,直接提交新的適配關(guān)系覆蓋即可,待新數(shù)據(jù)適配成功后線上可生效。


移動適配工具注意事項

1、只要PC站點與移動站點的主干一致,即可參與移動適配。舉例說明:PC站點ww.abc.com.cn    移動站點m.abc.net  屬于主干一致。當(dāng)然我們更建議您使用主域相同的PC站點和移動站點

2、建議您盡量使用規(guī)則適配進行對應(yīng)關(guān)系提交,一次提交可對于新增同規(guī)則的URL持續(xù)生效,無需多次反復(fù)提交,且處理周期相對URL提交更短,更易于維護和問題排查,是百度推薦使用的提交方式

3、使用正則格式進行規(guī)則適配,盡量使用最小的粒度來表示,這樣更容易校驗通過,比如:

       a).確定是純數(shù)字:([0-9]+) 或(\d+)

       b).確定是純字母:([a-zA-Z]+), 包括字母大小寫的情況

       c).確定是數(shù)字和字母混合串:

              方法一、((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+)

              方法二、([a-zA-Z0-9]+)

              說明:兩種混合串的區(qū)別:較長的一種為嚴(yán)格的數(shù)字和字母混排形式,且數(shù)字 和字母交替至少出現(xiàn)1次;
              較短的一種可支持純數(shù)字,純字母和數(shù)字字母混排

       d).確定有中文字符:((?:%[a-zA-Z-0-9]{2,})+)

       e).確定有參數(shù)值:([^&]+)

       f).確定有'-'和'_'連接字符串的替換規(guī)則:將連接的各個部分分別用對應(yīng)的規(guī)則替換

4、 百度搜索資源平臺對適配數(shù)據(jù)的校驗時間大約為10天,生效時間大約為1-2天。

5、適配成功后要繼續(xù)保持正確的適配關(guān)系,我們會重復(fù)驗證適配關(guān)系的有效性。


如何提升移動適配效果

首先,對已有的對應(yīng)關(guān)系持續(xù)進行適配,同時不斷建設(shè)新的對應(yīng)關(guān)系,增加適配覆蓋的范圍。其次,要確保已經(jīng)提交的對應(yīng)關(guān)系準(zhǔn)確。以下是常見的對應(yīng)不準(zhǔn)確錯誤,請網(wǎng)站進行自查,并及時修改。

1、手機頁不可用,比如死鏈。

2、robots封禁。放開對Baiduspider的robots封禁,以便Baiduspider獲取您PC站與手機站之間的對應(yīng)關(guān)系。

3、手機頁使用了ajax等異步加載的方法加載內(nèi)容主體。

4、格式錯誤。正則格式錯誤,文件格式錯誤等。

5、對應(yīng)關(guān)系錯誤

1)當(dāng)PC頁為內(nèi)容頁時,應(yīng)該適配到對應(yīng)的手機頁內(nèi)容頁,而實際卻適配到手機頁的首頁/列表頁

例如PC頁為http://www.aaa.com/Book/2083259.aspx,適配后的手機頁為http://m.aaa.con/?from=web

2)手機頁本身無主體內(nèi)容或主體內(nèi)容過少。

3)手機頁需登錄才能瀏覽主體內(nèi)容。

4)PC頁內(nèi)容與手機頁內(nèi)容不存在一一對應(yīng)關(guān)系。

  正確的對應(yīng)關(guān)系示例:

  PC頁http://www.58.com/mmmshandongrencai/

  手機頁http://m.58.com/w/mmmshandongrencai/


正則格式說明

以站點news.a.com適配到站點m.a.com為例:

適配PC鏈接地址為:http://news.a.com/09/1001/07/5KH8DE1F000120GR.html

適配移動鏈接地址為:http://m.a.com/news/09/1001/07/5KH8DE1F000120GR.html

步驟一:確定適配鏈接中的可替換參數(shù)或者路徑,得到其位置序號和類型。

適配PC鏈接:


根據(jù)網(wǎng)站自身url的層次結(jié)構(gòu),其中09,1001,07和5KH8DE1F000120GR為動態(tài)可替換的路徑。除5KH8DE1F000120GR為字母和數(shù)字混合外,其余均為純數(shù)字。

步驟二:根據(jù)可替換參數(shù)或路徑的類型,得到鏈接的表達形式。

使用正則匹配符號(\d+)或者(\w+)表示該路徑或參數(shù)。(\d+)表示純數(shù)字字符串,(\w+)表示字母數(shù)字下劃線組成的字符串。


步驟三:根據(jù)移動鏈接,以及可替換參數(shù)在步驟一中的位置序號,依次用${1},${2},……表示替換掉適配PC鏈接中的可替換參數(shù)或路徑,得到適配后的移動鏈接的pattern形式。


至此,便得到了適配的規(guī)則:

http://news.a.com/(\d+)/(\d+)/(\d+)/(\w+).html

http://m.a.com/news/${1}/${2}/${3}/${4}.html


正則格式示例:

1、純數(shù)字替換生成pattern例子:

eg1:url對應(yīng)關(guān)系:

http://www.abc.com/26299483.html->  http://m.abc.com/26299483.html
       pattern:
       http://www.abc.com/([0-9]+).html->  http://m.abc.com/${1}.html

eg2:url對應(yīng)關(guān)系:

http://www.abc.com/t26299483.html->  http://m.abc.com/26299483.html
       pattern:
       http://www.abc.com/t([0-9]+).html->  http://m.abc.com/${1}.html

2、純字母替換生成pattern例子:

eg:url對應(yīng)關(guān)系:

http://www.abc.com/fawliute/ -> http://m.abc.com/fawliute/
       pattern:
       http://www.abc.com/([a-zA-Z]+)/ ->  http://m.abc.com/${1}/

3、字母和數(shù)字混合的字符串替換生成pattern的例子:

eg1:url對應(yīng)關(guān)系:

http://www.abc.com/a1cc1n2q5y3/ ->  http://m.abc.com/a1cc1n2q5y3/
       pattern:
       http://www.abc.com/((?:[a-zA-Z]+[0-9]+|[0-9]+[a-zA-Z]+)[a-zA-Z0-9]+)/   -> http://m.abc.com/${1}/

注意:字母和數(shù)字混合字符串,字母和數(shù)字必須交替出現(xiàn)至少1次

有效例子:a13b,23a9,da3bc99,42a1c

eg2:url對應(yīng)關(guān)系:

http://news.abc.com/09/1001/07/5KH8DE1F000120GR.html
          -> http://m.abc.com/news/09/1001/07/5KH8DE1F000120GR.html
       pattern:
       http://news.abc.com/([0-9]+)/([0-9]+)/([0-9]+)/([ a-zA-Z0-9]+).html
          -> http://m.abc.com/news/${1}/${2}/${3}/${4}.html

4、對于字母和數(shù)字只交替出現(xiàn)一次的,可以分別用數(shù)字和字母進行正則替換:

eg:url對應(yīng)關(guān)系:

http://www.abc.com/az123/   ->     http://m.abc.com/az123/
       pattern:
       http://www.abc.com/([a-zA-Z]+)([0-9]+)/-> http://m.abc.com/${1}${2}/

5、中文字符串正則替換生成pattern例子:

eg:url對應(yīng)關(guān)系:

http://www.abc.com/長城花園/ -> http://m.abc.com/長城花園/
       pattern:
       http://www.abc.com/((?:%[a-zA-Z0-9]{2,})+)/-> http://m.abc.com/${1}/

6、由'-'或者'_'連接的數(shù)字或者字母替換生成pattern的例子:

eg:url對應(yīng)關(guān)系:

http://www.abc.com/byd-c3/-> http://m.abc.com/byd-c3/
       pattern:
       http://www.abc.com/([a-zA-Z]+)-([a-zA-Z]+)([0-9]+)/->http://m.abc.com/${1}-${2}${3}/

注意:'-'和'_'出現(xiàn)多次可以使用同樣的方式處理
       如:abc-134_x-1

7、對參數(shù)部分進行正則替換生成pattern的例子:

eg:url對應(yīng)關(guān)系:

http://www.abc.com/article.html?act=test&id=123  ->        http://m.abc.com/article.html?act=test&id=123
       pattern:
       http://www.abc.com/article\.html?act=([^&]+)&id=([^&]+)   -> http://m.abc.com/article.html?act=${1}&id=${2}


8、PC存在分頁對應(yīng)移動頁面生成pattern的例子:

eg:url對應(yīng)關(guān)系:

http://www.a.com/1234-1.htm  http://www.a.com/1234-2.htm   ->http://m.a.com/1234.htm
       pattern:
       http://www.a.com/([0-9]+)-([0-9]+).htm ->  http://m.a.com/${1}.htm



回復(fù)

使用道具 舉報

19#
 樓主| 發(fā)表于 2021-2-14 20:09:47 | 只看該作者
1. 什么是移動落地頁檢測工具?

移動落地頁檢測工具是由百度搜索資源平臺推出的,檢測移動落地頁是否符合《百度APP移動搜索落地頁體驗白皮書5.0》規(guī)范的工具。

移動落地頁檢測工具主要分為站點檢測和URL校驗兩個功能。站點檢測可對移動站點進行檢測,URL校驗是針對提交的URL頁面檢測。

本工具提供網(wǎng)站或URL重要問題反饋,但不是唯一問題,站點仍需全站自查。


2. 如何使用移動落地頁檢測工具?

第一步:登錄百度搜索資源平臺-搜索服務(wù)-優(yōu)化與維護-移動落地頁檢測

第二步:如站點未在平臺驗證,需先驗證站點后,才能使用落地頁檢測工具(站點驗證圖文詳解

第三步:移動落地頁檢測工具包括兩個功能:站點檢測與URL校驗;建議站點先使用站點檢測功能,整改后再使用URL校驗功能。

站點檢測可整體檢測移動站點是否符合《移動落地頁體驗白皮書5.0》,并抽樣反饋網(wǎng)站主要問題;網(wǎng)站也可使用URL檢測方式,單獨檢查頁面情況

第四步:站點參考問題反饋進行整改,整改完成后,濾鏡問題將2周后自動恢復(fù)


3. 移動落地頁檢測工具注意事項

① 站點檢測功能查詢結(jié)果天級更新。

② URL校驗功能查詢結(jié)果實時更新,每個賬號每天限使用5次。

③ 建議站點先使用站點檢測功能,整改后再使用URL校驗功能。

④ 若站點內(nèi)容已被濾鏡,站點按照《移動落地頁體驗白皮書5.0》規(guī)范整改后,濾鏡問題兩周自動恢復(fù)。

⑤ 若工具檢測反饋問題與站點情況不一致,請在反饋中心-網(wǎng)站支持-優(yōu)化與維護進行反饋。


回復(fù)

使用道具 舉報

20#
 樓主| 發(fā)表于 2021-2-14 20:09:48 | 只看該作者
1. 什么是移動落地頁檢測工具?

移動落地頁檢測工具是由百度搜索資源平臺推出的,檢測移動落地頁是否符合《百度APP移動搜索落地頁體驗白皮書5.0》規(guī)范的工具。

移動落地頁檢測工具主要分為站點檢測和URL校驗兩個功能。站點檢測可對移動站點進行檢測,URL校驗是針對提交的URL頁面檢測。

本工具提供網(wǎng)站或URL重要問題反饋,但不是唯一問題,站點仍需全站自查。


2. 如何使用移動落地頁檢測工具?

第一步:登錄百度搜索資源平臺-搜索服務(wù)-優(yōu)化與維護-移動落地頁檢測

第二步:如站點未在平臺驗證,需先驗證站點后,才能使用落地頁檢測工具(站點驗證圖文詳解

第三步:移動落地頁檢測工具包括兩個功能:站點檢測與URL校驗;建議站點先使用站點檢測功能,整改后再使用URL校驗功能。

站點檢測可整體檢測移動站點是否符合《移動落地頁體驗白皮書5.0》,并抽樣反饋網(wǎng)站主要問題;網(wǎng)站也可使用URL檢測方式,單獨檢查頁面情況

第四步:站點參考問題反饋進行整改,整改完成后,濾鏡問題將2周后自動恢復(fù)


3. 移動落地頁檢測工具注意事項

① 站點檢測功能查詢結(jié)果天級更新。

② URL校驗功能查詢結(jié)果實時更新,每個賬號每天限使用5次。

③ 建議站點先使用站點檢測功能,整改后再使用URL校驗功能。

④ 若站點內(nèi)容已被濾鏡,站點按照《移動落地頁體驗白皮書5.0》規(guī)范整改后,濾鏡問題兩周自動恢復(fù)。

⑤ 若工具檢測反饋問題與站點情況不一致,請在反饋中心-網(wǎng)站支持-優(yōu)化與維護進行反饋。


回復(fù)

使用道具 舉報

Archiver|手機版|小黑屋|教你搜 ( 魯ICP備16006309號

GMT+8, 2025-3-15 00:50 , Processed in 0.209111 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復(fù) 返回頂部 返回列表