【数据结构与算法】【算法思想】【MySQL数据库索引是】B+树

B+树特点

考虑因素

支持按照区间来查找数据
磁盘 IO 操作
N叉树

树的高度就等于每次查询数据时磁盘 IO 操作的次数
在选择 m 大小的时候，要尽量让每个节点的大小等于一个页的大小。读取一个节点，只需要一次磁盘 IO 操作。（分裂成两个节点）
【数据结构与算法】【算法思想】【MySQL数据库索引是】B+树

问题

跳表和B+树在实现难度和性能上有什么区别，在数据量很大的情况下，表现性能如何，为什么redis选跳表？
b+树主要是用在外部存储上，为了减少磁盘IO次数。
跳表比较适合内存存储。
实际上，两者本质的设计思想是雷同的，性能差距还是要具体看应用场景，无法从时间复杂度这么宽泛的度量标准来度量了。

B+ 树中，将叶子节点串起来的链表，是单链表还是双向链表？为什么？

对于B+tree叶子节点，是用双向链表还是用单链表，得从具体的场景思考。我想，大部分同学在开发中遇到的数据库查询，都遇到过升序或降序问题，即类似这样的sql: select name,age, … from where uid > startValue and uid < endValue order by uid asc(或者desc)，此时，数据底层实现有两种做法：
1）保证查出来的数据就是用户想要的顺序
2）不保证查出来的数据的有序性，查出来之后再排序
以上两种方案，不加思考，肯定选第一种，因为第二种做法浪费了时间（如果选用内存排序，还是考虑数据的量级）。那如何能保证查询出来的数据就是有序的呢？单链表肯定做不到，只能从头往后遍历，再想想，只能选择双向链表了。此时，可能有的同学又问了：双向链表，多出来了一倍的指针，不是会多占用空间嘛？答案是肯定的。可是，我们再细想下，数据库索引本身都已经在磁盘中了，对于磁盘来说，这点空间已经微不足道了，用这点空间换来时间肯定划算呀。顺便提一下：在实际工程应用中，双向链表应用的场景非常广泛，毕竟能大量减少链表的遍历时间

如果我们把散列表中的结点，也用链表串起来，能否支持按照区间查找数据呢？
答案是「肯定的」。JDK中的LinkedHashMap为了能做到保持节点的顺序（插入顺序或者访问顺序），就是用双向链表将节点串起来的。

笔记整理来源：王争数据结构与算法之美

【数据结构与算法】【算法思想】【MySQL数据库索引是】B+树

B+树特点

考虑因素

问题

相关推荐