來源: 作者: 發布:2020/2/1 瀏覽次數:2067
網站日志分析的作用大致包括:記錄你的網站在什么時間更新過什么東西,有沒有被黑客攻擊你的網站,記錄誰來點擊進過你的網站,記錄蜘蛛什么時間來抓取的,抓取的深度是多深,抓到那個頁面下不抓了.這樣當你的網站,發現蜘蛛長時間不來抓取后就可以找到問題根源,找到根源就能找到解決的辦法,而不會像一個無頭的蒼蠅到處亂轉,或者干等奇跡的發生,首先蜘蛛不來抓取,我們首先要看百度的抓取頻次,是從那天開始不抓的?不抓取之前自己是否做過什么違反搜索引擎規則的事...等等這一系列跟網站日志有關的。
1、使用日志分析工具-金花站長工具
百度金花站長工具去下載
打開金花站長工具->數據分析->網站日志分析,選擇日志文件目錄
2、分析是否收錄
舉例1月31日發布文章網站優化一-寫好title很重要,2月1日我查看網站日志看這篇文章是否被百度收錄了
找到1月31日日志文件
查看百度抓取記錄,如果查找很麻煩也可以導出到excel中查找
查看是否收錄
3、404錯誤
404錯誤就是網頁打不開,可以檢查下網頁的地址是否改變了,及時修復404錯誤避免搜索引擎經常抓取錯誤網頁給搜索引擎留下不好的印象。
狀態碼200、304都是成功的
4、日志文件大小
日志文件大小反應了網站的受歡迎程度,訪問量越大日志文件就越大。通常關注下日志文件大小變化趨勢,如果突然增加很多或減少很多就用看是什么原因引起的。
5、日志文件包含的信息
經過上面的講解大家應該對日志文件有了初步的了解,接著我們講點更專業的,一條標準的日志記錄應該包含哪些信息
遠程主機(Remote Host)的IP地址/名字
登錄名(Log Name)
登錄全名(Full Name)
請求發生的日期(Date)
請求發生的時間(Time)
和標準格林威治時間的差值(GMT Offset)
請求的方法(Request Method)
請求的文件的地址(File)
請求遵守的協議(Protocol)
請求的狀態(Status)
被請求文檔的長度(Length)
下面是一條標準的日志文件記錄:
2020-01-31 13:01:17 192.168.0.5 GET /news_view3.asp id=1381 80 - 220.181.108.186 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - 200 0 0 132
由于服務器的設置問題,格式會有所不同,但是包含的內容是一樣的。
6、分析來訪者身份
在某些特殊情況下我們需要確認某個訪問IP,下面舉例說明。
比如我使用了百度商橋,看到每天都有一個來自北京的IP訪問我網站,而且每次都只訪問一個頁面就退出
記錄下這個IP:111.206.36.135,然后直接在日志文件里查詢
2020-01-31 13:01:05 192.168.0.5 GET /uploadfile/20191020153017659.jpeg - 80 - 111.206.36.135 Mozilla/5.0+(Linux;+Android+6.0;+Redmi+Note+4+Build/MRA58K;+wv)+AppleWebKit/537.36+(KHTML,+like+Gecko)+Version/4.0+Chrome/76.0.3809.89+Mobile+Safari/537.36+T7/11.19+SP-engine/2.15.0+baiduboxapp/11.19.0.11+(Baidu;+P1+6.0) http://www.ipgeni.com/products_view.asp?id=42&tid=42 200 0 0 460
分析發現baiduboxapp是百度手百UA程序,這個訪問者對我網站是有用的,果斷打個標記
來源:巨靈鳥 歡迎分享本文
上一個文章:網站優化五-H1標簽
下一個文章:網站優化一-寫好title很重要