国产综合久久久久久鬼色-国产综合久久一区二区三区-国产综合欧美日韩视频一区-国产综合视频在线观看-国产综合视频在线观看一区-国产综合视频在线无码

朗創營銷,專業鄭州抖音推廣,鄭州短視頻代運營,鄭州抖音代運營服務公司 聯系我們:185-3093-0310
聯系電話
當前位置:朗創網絡營銷 > 網站優化 >

如何查看網站被百度抓取的情況

加入時間:2013-01-09 11:39:34文章來源: 朗創網絡營銷
baiduspider


如何查看網站被百度抓取的情況

 
 

Baiduspider - 別名百度蜘蛛,我們查看網站被百度抓取的情況主要是分析網站日志里百度蜘蛛Baiduspider的活躍性:抓取頻率,返回的HTTP狀態碼。比如一天內百度來爬取多少次,返回的是200,還是404或者其他HTTP狀態碼。

1、查看日志的方式:

通過FTP,在網站根目錄找到一個日志文件,文件名一般包含log,下載解壓里面的記事本,這即是網站的日志,記錄了網站被訪問和操作的情況。

因為各個服務器和主機的情況不同,不同的主機日志功能記錄的內容不同,有的甚至沒有日志功能,這一點,您需要聯系您的空間服務商。

2、日志內容如下:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 404 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)"  

分析:

GET /bbs/thread-7303-1-1.html   代表,抓取/bbs/thread-7303-1-1.html 這個頁面。

404  表示抓取的這個頁面不存在或者出現錯誤。

8450  代表抓取了8450個字節。

如果你的日志里格式不是如此,則代表日志格式設置不同。

很多日志里可以看到 200 0 0和200 0  64 則都代表正常抓取。

3、抓取頻率是通過查看每日的日志里百度蜘蛛抓取次數來獲知。抓取頻率并沒有一個規范的時間表或頻率數字,我們一般通過多日的日志對比來判斷。當然,我們希望百度蜘蛛每日抓取的次數越多越好。

備注:如果您實在不了解上面的代碼含義,推薦您使用日志分析工具,如逆火日志分析工具,光年日志分析工具,都是比較有名的。

在網站出現問題的情況下,通過查看網站日志,查看網站的HTTP返回值是否正常,這篇文章總結了常見的HTTP返回值:日志中的HTTP狀態碼都代表什么