关于“百度收录”的几点见解

百度对“留点后路”收录速度基本都在几分钟内,对这个速度我没意见,但就在半年之前,百度对本站的收录还在论“天”算。我的QQ群里有童鞋问这其中的原委,说实话,猛一下我也没什么理由,总结了几条,供参考:

上面这张图是在“百度统计”中获得,应该有比较大的权威。这张图记录了从2010年下半年至今,百度搜索引擎对我站点的收录情况。下面做个简单分析:

第一阶段:图中的最低阶段。在2010年9月之前,百度的收录量几乎为零,零零星星地涨跌互现,而那时候的状况是:主机是Godaddy Deluxe那款,配有独立ip,没有任何其他扶住措施,那时候的文章数量在150篇左右。

第二阶段:图中2010年9月到2011年6月之间,一段几乎没有上涨曲线、非常平滑的一段。那时的状况是:主机为Linode,节点用的是Fremont或Dallas,一直用的独立ip,此时我的文章数量在230篇左右。

第三阶段:图中2011年6月到2011年8月左右,稍有上涨迹象的一段。状况是:主机用的Linode Dallas,外加免费CDN,这个CDN的路由策略是将中国电信用户分配到洛杉矶节点、中国联通用户分配到san jose节点,都是西海岸。当时的文章数量在270篇左右。

第四阶段:图中后段那个很明显的“大坑”。这个阶段的百度收录量呈现大幅下降趋势,收录量最低时基本与第二个阶段持平,持续时间大概在2011年9月当月内。当时的状况为:主机使用的“阿里云”(传闻中的百度、阿里巴巴互掐或许是真的),并使用的独立ip对外服务。而这时候的文章数量在300篇左右。

第五阶段:重新出现上涨趋势,时间在2011年10月初到2011年11月初。这个时候我又重新转会了linode,但节点是日本,并且开始使用国内的免费CDN Webluker,用CDN的节点ip代替linode日本的独立ip,并且在这个阶段末期,我开始在站内加入“百度统计”代码,取代了之前的cnzz和google analytics。当时的文章数大概在330篇。

第六阶段:就发生在这个月,上图中最后那个“直冲云霄”的直线!这段时间内,主机+国内免费CDN的结构没变,唯一变化的就是加装了两个插件:Meta Keywords Generator和Permalinks。第一个插件的作用是为每个页面生成Meta keywords信息;第二个则是为了增加内链。目前为止,我的总文章数大概在390篇左右。

通过以上六个阶段的“文章数量”与收录数量之间的对比,不难发现,百度对某个站点的收录根本不在于你有多少文章,这个数字和你的文章数不成正比。第二,网站加载速度对收录的影响比较大,这从我的站点从美国搬到日本,再使用国内cdn这个阶段内的收录变化可以看出。第三,网页关键字、Meta信息、图片alt信息等一系列所谓“SEO”内容,对收录的影响也是很大的,看图中那根“擎天柱”就知道了。第四,用“百度统计”替代其他第三方统计工具,或许也会出现意想不到的效果(此纯属杜撰,莫认真)。

另外,还有点切身体会就是:不间断地写自己的原创文章,因为不光google,百度现在也有自己一套甄别是否原创的算法。与此同时可以去chinaz、admin5、cnbeta、hostloc、wordpress.org.cn等“百度权重”较高的站点投递文章,在其中加入自己的反向链接,也就是“沾光”,可以在某种程度上提高某些个页面或某几个关键词的排名。

以上就是我关于“百度收录”的几点个人见解,不成熟,仅供参考。