“b数”(B树)是个怎么回事

要说B树(balance tree),首先需要了解的是二叉树(binary tree)

简单说一下B树产生的原因。B树是一种查找树,我们知道,这一类树(比如二叉查找树,红黑树等等)最初生成的目的都是为了解决某种系统中,查找效率低的问题。B树也是如此,它最初启发于二叉查找树,二叉查找树的特点是每个非叶节点都只有两个孩子节点。然而这种做法会导致当数据量非常大时,二叉查找树的深度过深,搜索算法自根节点向下搜索时,需要访问的节点也就变的相当多。如果这些节点存储在外存储器中,每访问一个节点,相当于就是进行了一次I/O操作,随着树高度的增加,频繁的I/O操作一定会降低查询的效率。

二叉树:

 定义:平衡二叉树是基于二分法的策略提高数据的查找速度的二叉树的数据结构

特点:(1)非叶子节点只能允许最多两个子节点存在。

           (2)每一个非叶子节点数据分布规则为左边的子节点小当前节点的值,右边的子节点大于当前节点的值(这里值是基于自己的算法规则而定的,比如hash值);

           (3)树的左右两边的层级数相差不会大于1;

           (4)没有值相等重复的节点;

“b数”(B树)是个怎么回事

B树

定义:B树和平衡二叉树稍有不同的是B树属于多叉树又名平衡多路查找树(查找路径不只两个)

特点(1)排序方式:所有节点关键字是按递增次序排列,并遵循左小右大原则;

            (2)子节点数:非叶节点的子节点数>1,且<=M ,且M>=2,空树除外(注:M阶代表一个树节点最多有多少个查找路径,M=M路,当M=2则是2叉树,M=3则是3叉);

            (3)关键字数:枝节点的关键字数量大于等于ceil(m/2)-1个且小于等于M-1个(注:ceil()是个朝正无穷方向取整的函数 如ceil(1.1)结果为2);

            (4)所有叶子节点均在同一层、叶子节点除了包含了关键字和关键字记录的指针外也有指向其子节点的指针只不过其指针地址都为null对应下图最后一层节点的空格子;

备注:非叶节点是除了最下面没有分叉的节点如下图的AC-EF-HKL-NP-RS-WXYZ,关键字是节点上的值(和二叉树节点上的值类似)如下的字母就是

“b数”(B树)是个怎么回事

    下面根据B树的形成过程,理解一下

定义一个5阶树(平衡5路查找树;),现在我们要把3、8、31、11、23、29、50、28依次插入 这些数字构建出一个5阶树出来;

规则:

(1)节点拆分规则:当前是要组成一个5路查找树,那么此时m=5,关键字数必须<=5-1(这里关键字数>4就要进行节点拆分);

(2)排序规则:满足节点本身比左边节点大,比右边节点小的排序规则;

先插入 3、8、31、11

“b数”(B树)是个怎么回事

再插入23、29

“b数”(B树)是个怎么回事

再插入50、28

“b数”(B树)是个怎么回事

这样大概就了解来B树是如何形成的了。