百度为什么不收录网站?有很多同学在QQ或者群里问我,为什么我的网站不被收录?能不能帮我看下之类的,今天总结下网站不被收录的几个因素,你只要花费10分钟的时间阅读完这个文章,相信你以后再也不用问别人网站为什么不被收录了。先来说下,百度收录的大体流程 。蜘蛛通过外部链接发现你的网站—-爬行—–存储到数据库—–展现(详情请见下图)。这一个非常简单的解释,实际上搜索引擎要比这复杂的,文章下边我会和大家慢慢解释。了解了搜索引擎的基本原理后,我们回过头来说下不被收录的问题。
二:页面的质量。从三个方面去考虑。第一个就是页面内容的质量,文章质量都是复制的,可能被百度的去重算法给过滤掉,自然也就无法收录。另外还有页面中存在大量的死链接或者整个页面采用了FLASH等不友好的设计,都会影响百度对网站的收录。
三:网站中存在违禁词。包括网站的TITLE和页面中出现的大量的违禁词的话。这样的页面也就会被百度过滤。
四:度娘的特殊时期。部分时期如XX会期间,度娘怕惹事,就会降低对新站的收录。这个度娘虽然不承认,但是我们经过大量的时间总结确实有这种现象。
五:网站设置不当。很多程序员在调试程序的时候,担心被百度抓取,采用的方法就是使用 robots.txt来屏蔽蜘蛛的爬行。有的时候容易遗忘,所以要检查下这个地方。
六:域名正在惩罚期。这个是挺可悲的一件事。很多新手注册了一个域名结果网站死活不被收录。百度惩罚时间越来越长了。如果这个域名上一个使用者做站被惩罚,域名刚好到期被你注册后。那么你使用的域名还在惩罚期,是不可能被收录的。另外说明下,这种现象有不好。