网站诊断:网站为什么不被收录 快照不更新
author:一佰互联 2012-05-09   click:1207

最近在一些站长论坛里面经常有看到人在问:为什么我发的内容百度不收录呢?为什么我网站的快照不更新呢?为什么我收录的内容又被百度删除了呢?其实这些问题归根到底也就是一个问题,那就是网站内容质量的问题。当然,或者那些人的目的也并不是真的咨询问题的,为的可能也就是在询问问题的时候发布一个外部链接而已。不过本人想了想,这其实也是很多seo从业人员初期会遇到的问题,所以也就整理了一些想法,写出这样一篇关于网站诊断的文字出来。至于是不是真的实用,那就是仁者见仁智者见智了。


 

为什么网站不被收录



  在继续这个话题之前我们应该先了解一个概念,那就是搜索引擎收录的是什么?对于搜索引擎来说,收录的是页面,所以说,网站想要被更多的收录,那就需要有更多的页面提供给搜索引擎,而页面对于我们来说就是网站的内容,一个针对网站主题发布的内容,然后经过程序生成的页面。那么网站的内容从什么地方而来呢?

网站内容的来源


  简单来说,网站的内容从发布来源分为两个部分,一是网站本身发布的,二是用户生成的。如果从内容的原创性上来看,同样也可以分为两个部分,一个是原创,二就是伪原创了。而我们这里重点要说的是第二种分类。原创的内容是网络上无法找到的,这部分内容对于搜索引擎来说是比较喜欢的,而伪原创就需要看具体怎么去做的了,这里可以参考《如何伪原创》一文。

搜索引擎收录的标准

  这个具体可以参考一下百度官方发布的文档《百度搜索引擎优化指南2.0》,里面对于很多内容都有比较详细的说法,作为新手站长以及新手seo的话,这个参考文档是进入seo行业必须阅读的文档。

为什么发布的内容不收录


  其实发布的内容不收录的问题很多网站都有,一般造成不收录的原因也不多。第一,检查网站的robot.txt协议,看这个协议中是不是有屏蔽了搜索引擎蜘蛛的命令?第二,网站的内容。网站的内容是不是采集而来,是不是在互联网上有很多的重复,如果是的话,尽量原创吧。第三,太多的广告弹窗,这个其实也会造成不被收录的,当然,如果网站权重高的话影响也不是太大的。第四,还是内容,那就是内容可能不是原创的,但是也不是采集的,而是伪原创或者是杂乱的,这个虽然重复度不高,但是也有可能不被收录。

为什么快照不更新


  可能的原因可能是服务器,所以一个网站必须要保持稳定。如果所在空间不稳定的话,建议更换一下稍好的。第二也就是首页内容了,首页其实也是一个页面,不过对比内容页来说权重稍高而已,所以也需要保持一定量的更新。第三,友情链接。看看是不是有被降权的友情链接连带了。

为什么收录的页面不见了


  也有看到一些人问原本收录的页面最近总是不断的减少。那么这其实和不收录的问题差不多的。主要看文章质量,如果文章质量比较烂的话,收录后经过搜索引擎进行内容重复度对比,发现相似度太高,而且网站的权重也不如其他站的话,就有可能被去重了。这也就是收录减少的原因。

  罗宾个人建议使用百度统计,主要的功能和一般的统计代码都是比较类似的,不过其中有一个百度索引的功能可以让站长作为参考的作用,因为通过索引数据我们可以判断出网站的页面是没有被收录还是被索引了没有放出来。然后结合网站访问日志,研究搜索引擎蜘蛛的爬行记录以及返回代码进行判断。

  不管是在网站建设还是网站优化的时候,我们都会遇到很多的问题,不过一般来说,问题都不会是第一次出现的,这个时候善用搜索引擎的话可以找到很多问题的答案。当然,对症下 才是最重要的,所以我们在做优化的时候不应该是人云亦云,而应该是实战,实战再实战。然后对实战中的各种数据进行分析,那样才能制定出最完善的seo优化策略,让我们的网站优化工作事半功倍。