为什么说数据量越大建索引越好呢？B树解答下

大家都知道索引其实就是数据结构。我们经常使用的就是B树。

这里我用一个简单的例子来说明，数据量越大，建立索引越好。如图：我画了个数据结构

左侧是表里面的数据，右侧是根据年龄尽量的索引。

现在我们想要查找年龄为20的数据，在左侧会进行全表扫描，共查找7次，才找到。右侧，在索引的情况下，查找2次就找到了。可能有人会说，7次和2次差不了多少，这只是在数据量小的情况下。数据量大的情况下，差的可是很多的。而且B数类似二叉树。相信大家都知道二叉树是怎么回事，这样比如我们在对索引字段进行排序时，是不是也节省了时间呢。

再来看下三层B+树

为什么说数据量越大建索引越好呢？B树解答下

比如我们想要找到28，只需3次就可以找到。第一次看是在17-35之间，也就是p2的位置。（注意：p1就是小于17的，p2是17-35之间的，p3是大于35的）

3层Btree可以存储上百万的数据。Btree一般指的是B+,数据全部存放在叶节点中。

B+树中查询任意的数据次数：n次（B+树的高度）

看了上面的介绍是不是感觉索引很好，但是它也是有弊端的。

索引弊端：

索引本身很大，可以存放在内存/硬盘。（通常为硬盘）
索引不是所有情况均适用：少量数据，频繁更新的字段，很少使用的列
索引会降低增删改的效率

索引优势：

提高查询效率（降低IO使用率）
降低CPU使用率

说明：频繁的更新字段，就会经常性的改变右侧的索引结构，造成增删改的效率下降。

为什么说会降低CPU的使用率。比如我们通过年龄升序降序。不加索引的情况下，我们要将整个表进行排序，但是有了右侧的索引结构，本身就已经排好顺序了，我们可以直接使用。

大家有疑问可以添加qq群：789318548，也可以关注今日头条《老徐聊技术》我会解答。

为什么说数据量越大建索引越好呢？B树解答下

相关推荐