网站日志的解读方法,终于能看懂日志了!

添加时间:2020-01-19 08:41:00

自从自己从事SEO网站优化以来,自己慢慢的去关注网站日志。网站日志剖析成为自己每天工作的榜首件事情,每天一到公司榜首时间便是对昨日的网站日志进行剖析。或许部分站长们还不会剖析网站日志,也有少部分觉得剖析网站日志便是在浪费时间,天天看着那些数据有什么效果。这里小编觉得至少有四点咱们能够了解到。

首先、确认是否有蜘蛛过来爬行

怎么确认是否有蜘蛛过来爬行:

1、  经过观看网站日志代码进行观看,这个针对剖析高手

2、  经过网站日志剖析工具进行观看,这个比较适合新手运用

经过网站日志剖析东西能够直接检查站点有哪些页面已经被蜘蛛爬行抓取了。

第二、客户ip便知蜘蛛类型。

1、220.181.108.*ip段的百度蜘蛛(提权蜘蛛)

2、123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛)

3、123.125.68.*ip段的百度蜘蛛(调查蜘蛛)

4、117.28.255.*ip段的百度蜘蛛(冒充蜘蛛)

第三、检测页面状况正常与否

经过网址日志咱们能够直接的服务器响应代码看出咱们的页面哪些有问题,哪些正常的。一般情况下回来的状况码是200的话阐明正常,呈现404的话,阐明页面呈现问题。

第四、搜索引擎对站点的友好程度

从网站日志,咱们能够直接的看出蜘蛛来咱们站点的匍匐次数,爬行次数越多阐明蜘蛛对咱们的站点越友好。

经过上图咱们能够直接的看出蜘蛛对咱们站点的匍匐次数了,可是这里边的匍匐次数里边也存在冒牌的蜘蛛,所以咱们还需要经过客户ip进行确认哪些是真实的蜘蛛,哪些是冒牌的。

下面再对以上四点进行进一步的探知:

针对上面榜首、咱们能够直接的检查哪些页面被匍匐抓取了,哪些没有。随着算法的不断更新,新站的调查期越来越长了,以至于好多新站长更新的文章经过site:域名,查收录都没有显现。这大部分是因为搜索引擎滞留了没有及时开释。

针对上面第二、咱们能够经过客户ip区分站点安全信息及文章内容质量怎样

根据不同的IP咱们能够剖析网站是个怎样的状况,以下常见的百度蜘蛛IP:

1、123.125.68.*常来,其他来的少,那么站点进入沙盒,或被者降权的可能性非常高。

2、220.181.68.*每天只添加没有减少,则是进入沙盒或许被降权的预兆。

3、220.181.7.*、123.125.66.* 搜索引擎开始要抓取东西。

4、121.14.89.*摆脱了新站调查期。

5、203.208.60.*站点开始不正常。

6、210.72.225.*这个ip段不间断巡逻各站。

7、220.181.108.*高质量文章内容页或主页抓取。

一般成功抓取回来代码都是 200 0 0回来,若回来状况显现304 0 0代表网站没更新,蜘蛛来过,但没抓取。假如是 200 0 64,那么也别担忧,这只不过是一些动态页面的抓取。

针对上面第三、假如服务器回来状况,比如200 表示正常拜访。404 表示页面不存在。304代表网页还没更新。这些都能够经过网站日志里边的代码直接看出来的。假如大量的呈现404的话,那么非常有必要对这些404的页面进行采取措施。咱们能够用robots.txt协议来屏蔽这些页面,不让搜索引擎来匍匐这个页面。