为什么说数据量越大建索引越好呢?B树解答下
大家都知道索引其实就是数据结构。我们经常使用的就是B树。
这里我用一个简单的例子来说明,数据量越大,建立索引越好。如图:我画了个数据结构
左侧是表里面的数据,右侧是根据年龄尽量的索引。
现在我们想要查找年龄为20的数据,在左侧会进行全表扫描,共查找7次,才找到。右侧,在索引的情况下,查找2次就找到了。可能有人会说,7次和2次差不了多少,这只是在数据量小的情况下。数据量大的情况下,差的可是很多的。而且B数类似二叉树。相信大家都知道二叉树是怎么回事,这样比如我们在对索引字段进行排序时,是不是也节省了时间呢。
再来看下三层B+树
比如我们想要找到28,只需3次就可以找到。第一次看是在17-35之间,也就是p2的位置。(注意:p1就是小于17的,p2是17-35之间的,p3是大于35的)
3层Btree可以存储上百万的数据。Btree一般指的是B+,数据全部存放在叶节点中。
B+树中查询任意的数据次数:n次(B+树的高度)
看了上面的介绍是不是感觉索引很好,但是它也是有弊端的。
索引弊端:
- 索引本身很大,可以存放在内存/硬盘。(通常为硬盘)
- 索引不是所有情况均适用:少量数据,频繁更新的字段,很少使用的列
- 索引会降低增删改的效率
索引优势:
- 提高查询效率(降低IO使用率)
- 降低CPU使用率
说明:频繁的更新字段,就会经常性的改变右侧的索引结构,造成增删改的效率下降。
为什么说会降低CPU的使用率。比如我们通过年龄升序降序。不加索引的情况下,我们要将整个表进行排序,但是有了右侧的索引结构,本身就已经排好顺序了,我们可以直接使用。
大家有疑问可以添加qq群:789318548, 也可以关注今日头条《老徐聊技术》我会解答。