百度对每一个网站都是平等对待的,它会尝试抓取网站中的每一篇文章。但是,在抓取这些文章之前,百度需要对这些文章进行质量评估,而评估的结果决定了百度是否抓取这篇文章并列入它的索引。有人会说,难度百度会人工对整个互联网中以千亿计的的文章进行审核和评估吗?当然不是,百度有一套智能化的抓取机制,通过某种既定的程序对内容进行分析,最后决定是否抓取和建立索引。
什么样的文章会被百度收录?
搜索引擎的原则是将用户最需要、最有参考价值的内容呈现给搜索引擎用户。在这个前提下,我们就能够获得一个清晰的思路了。什么是高质量、有参考价值的文章呢?百度官方给出的解释是:通过对某个方面的专业分析、用心编辑出来并且含有非常高的可读价值的原创文章会被百度优先考虑。通过对网上其它作者写的文章进行深度修改并导入自己的一些新观点,用心编辑成一篇新的文章,百度也会优先考虑。比如,某个网站中的文章都是从各种网站中抄袭而来的,那么,这些文章很有可能不会被收录,而且还可能面临搜索引擎对网站的进一步惩罚,因为百度认为,这些文章毫无价值。
什么样的文章会被百度拒绝?
违反国家法律法规的文章根本不需要考虑,肯定不会收录,并且网站也会受到相应的惩罚。然后就是互联网上已存在大量同样内容的文章,百度认为,这些资料已经过时了,没有任何参考价值,极有可能不被收录。过度优化的文章同样不会被收录,文章里大量充斥着各种关键词,大大影响用户的可读性,即便这是纯原创的文章,百度会认为,你正准备人为干扰搜索引擎排序方式,也极有可能不会被收录。但是,适当的优化是可以的,它可以帮助搜索引擎更加了解这篇文章的重点,并推荐给用户浏览。各种违反百度的行为准则的文章,皆有可能不被收录。比如在一个教育网行业站里发布一些有关医药的内容;比如在一篇介绍农业的文章里插入与本文毫无关联的广告等等。