做网站优化不能单凭个人臆断来决定网站发展方向,而是应该有计划,有目的的去维护网站,否则就算是累死编辑,写上千篇高质量原创,网站也未必能获得优质排名,文章也未必会被抓取。那么我们怎么才能知道网站哪里除了问题呢?其实我们只要拿到这份网站体检“心电图”就能很快找到问题所在。
我所说的网站“心电图”其实就是网站日志。网站日志里能让我们看到用户以及各个搜索引擎蜘蛛的抓取情况,那个栏目甚至是哪篇文章几点被抓取过多少次,都是可以看到的,我们可以通过服务器反馈的代码了解网站到底是哪里出了问题。
网站日志中比较常见的问题:
1、反馈代码200:这个是正常抓取代码,表示页面能够正常访问,出现这个代码没什么太多问题。
2、反馈代码300:属于正常代码,个人认为是根据用户的需求跳转到对应页面。
3、反馈代码301:没什么毛病,用户访问某一个页面,自动跳转到另一个页面,301是可以传递权重的,如果我们网站改版了,URL有所变化,那么做301跳转到新的URL上提交给百度,这样过段时间页面权重会集中在新的URL上,302代码同理,不多做介绍。
4、反馈代码304:有问题,这个代码个人感觉还是比较重要的,做网站如果304比较多会影响到收录的,这个是我亲身测试过,304代码的意思是用户或者搜索引擎蜘蛛访问某一个页面,但是页面和上次来访时结果是一样的,也就是说,你这个页面长期未更新,如果每次都这样,那么搜索引擎蜘蛛会降低对这个页面的青睐度,抓取频次会下降,这样一来直接导致我们网站收录量降低。
5、反馈代码403:没太大问题,这种反馈代码是比较正常的,因为我们不可能让用户访问所有资源,服务器虽然接到了用户的请求,但是还是拒绝处理,这个问题对我们seo来说并不是特别严重的问题。
6、反馈代码404:有问题需要关注。所谓404大家应该都知道了,就是页面丢失了,用户访问却没有对应信息,就会在服务器里反馈404错误。
5、而500等这些代码都是属于服务器问题了,如果总是反馈500这些,我们可以找服务器的运营商解决问题,比较常见的如下:
①500服务器内部错误,找运营协商解决。
②501服务器不具备完成请求的功能,找运营商解决问题。
……
好吧,懒得写了,自己网上搜搜都有,总之工作上遇到500问题直接甩锅给服务器运营商就可以了。
我们可以通过反馈的代码,来解决一些比较直观的问题,304问题页面更新频率低,看看能不能通过一些相关文章调取解决此类问题,另外一些经常不更新的页面,设置nofollow也能避免经常出现304问题。
而404不用多说了发现就及时处理掉,提交一份死链文档,给搜索引擎看,如果由于之前误操作删除了某一个栏目导致死链非常多,可以通过robots来屏蔽掉整个栏目,如果某一个动态栏目总是出现死链直接屏蔽抓取,用这个Disallow:/?*。
网站日志一般都是服务器里生成的,具体怎么操作,正所谓知之为知之不知为不知,我是不懂,也就不打诳语了,反正我的服务器后台有一个log文件夹,里边都是每天生成的网站日志,网站日志尾缀都是.log,如果找不到直接问服务器运营商要,烦死他们丫的,哈哈……
至于网站分析工具,那还是真挺多的,我现在就用爱站工具包,不过如果你的网站日志比较大,它就要收费了。还有网上有一个拉格好在线分析,不过最近貌似不能用了。比较专业的seo喜欢用什么光年、逆火一类的分析工具,但我看基本就是为了做图表好看一些,当然我就用过一两次,可能有些老牌seo比较青睐这个,具体如何取舍看个人需求。
总结:网站日志就是我们网站的“心电图”哪里有问题,直接看它就能找到,解决了这些基本问题收录慢慢就可以保障了,但是随着各大搜索引擎算法不断完善,想要获取好的排名,还需要多了解一些算法要求,像内容质量,网页布局等等,都是需要不断调整,以后有机会我再聊聊关于最近的一些算法问题。
本文为北京赵岩seo博客独家原创,如需转载按照下边的要求,否则我可能有时间的话会维权的……