之前大壮一直以为收录跟引索是一回事儿。只是称呼不同而已。直到今天偶然发现了百度官方的一篇文章《一张图看懂收录与索引的区别》才知道,收录跟引索的区别(话说之前一直以为引索只是蜘蛛工作流程中的名字而已。)现在讲原文主要内容摘录如下:

1,收录和索引分别指什么
  收录:页面被Baiduspider发现、分析过;
索引:Baiduspider经初步分析后认为有意义,做建库处理;(如果对引索、建库的意思不太明白,推荐阅读这篇《百度搜索引擎技术原理

》)

2, 收录和索引的关系
  包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。

3, 收录和索引的意义
【收录意义1】收录是索引的前提,站点需要保持服务器稳定、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路
【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换

【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)
【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中

4, 如何查询收录量和索引量
  目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider(《如何识别百度蜘蛛》)
真实索引量只能通过百度站长平台索引量工具查询