B-树,B+树,红黑树的简单介绍

B+树

  • 介绍:
    • B+树是基于B-树的一种变体,它有着比B-树更高的查询性能。
  • 一个m阶的B+树具有如下几个特征:
    • 有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点
    • B-树,B+树,红黑树的简单介绍
    • 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接
    • B-树,B+树,红黑树的简单介绍
    • 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
    • B-树,B+树,红黑树的简单介绍
  • B+树的优势:
    • 单一节点存储更多的元素,使得查询的IO次数更少。
      • 如果是B-树的话,查到6,8之后还要返回根结点,查找它的右子树,找到9,11
    • B-树,B+树,红黑树的简单介绍
    • 所有查询都要查找到叶子节点,查询性能稳定。
    • 所有叶子节点形成有序链表,便于范围查询。

B-树:磁盘的IO次数由B-树的高度决定

  • 介绍:
    • 是一种自平衡的,能够保持数据有序。这种数据结构能够让查找数据、顺序访问、插入数据及删除的动作,都在对数时间内完成。
    • B树,概括来说是一个一般化的二叉查找树(binary search tree),可以拥有多于2个子节点。与自平衡二叉查找树不同,B树为系统大块数据的读写操作做了优化。
    • B树减少定位记录时所经历的中间过程,从而加快存取速度。B树这种数据结构可以用来描述外部存储。这种数据结构常被应用在数据库文件系统的实现上。
       
  • 一个m阶的B-树具有如下几个特征:
    • 根结点至少有两个子女。
    • 每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m
    • 每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m
    • 所有的叶子结点都位于同一层。
    • 每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
    • 三阶为例:B-树,B+树,红黑树的简单介绍
  • 插入操作:自平衡
    • 自顶向下查找4的节点位置,发现4应当插入到节点元素3,5之间。
    • B-树,B+树,红黑树的简单介绍
    • 节点3,5已经是两元素节点,无法再增加。父亲节点 2, 6 也是两元素节点,也无法再增加。根节点9是单元素节点,可以升级为两元素节点。于是拆分节点3,5与节点2,6,让根节点9升级为两元素节点4,9。节点6独立为根节点的第二个孩子。
    • B-树,B+树,红黑树的简单介绍
  • 删除操作:
    • 自顶向下查找元素11的节点位置。
    • B-树,B+树,红黑树的简单介绍
    • 删除11后,节点12只有一个孩子,不符合B树规范。因此找出12,13,15三个节点的中位数13,取代节点12,而节点12自身下移成为第一个孩子。(这个过程称为左旋

    • B-树,B+树,红黑树的简单介绍

    • B-树,B+树,红黑树的简单介绍

红黑树

  • 先说说二叉查找树(BST):
    • 左子树上所有结点的值均小于或等于它的根结点的值。
    • 右子树上所有结点的值均大于或等于它的根结点的值。
    • 左、右子树也分别为二叉排序树。
    • B-树,B+树,红黑树的简单介绍
  • 但是二叉查找树(BST)也有缺陷:
    • 假设初始的二叉查找树只有三个节点,根节点值为9,左孩子值为8,右孩子值为12:
    • B-树,B+树,红黑树的简单介绍
    • 接下来我们依次插入如下五个节点:7,6,5,4,3。依照二叉查找树的特性,结果会变成什么样呢?
    • B-树,B+树,红黑树的简单介绍
    • B-树,B+树,红黑树的简单介绍
  • 如何解决:
    • 使用红黑树解决二叉查找树多次插入新节点导致的不平衡。
  • 红黑树定义:
    • 红黑树是一种自平衡的二叉查找树。
  • 红黑树除了符合二叉查找树的基本特性外,还具有下列附加特性:
    • 每个节点要么是红色,要么是黑色。
    • 根节点必须是黑色
    • 每个叶子节点都是黑色的空节点(NIL节点)。
    • 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
    • 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。
    • B-树,B+树,红黑树的简单介绍
  • 什么情况下会破坏红黑树的规则,什么情况下不会破坏规则呢?我们举两个简单的例子:
    • 向原红黑树插入值为14的新节点:
    • B-树,B+树,红黑树的简单介绍
    • 向原红黑树插入值为21的新节点:
    • B-树,B+树,红黑树的简单介绍
    • 由于父节点22是红色节点,因此这种情况打破了红黑树的规则4(每个红色节点的两个子节点都是黑色),必须进行调整,使之重新符合红黑树的规则。
    • 调整:有两种方法【变色】和【旋转】,旋转又分为:【左旋转】【右旋转】
  • 变色:

    • 为了重新符合红黑树的规则,尝试把红色节点变为黑色,或者把黑色节点变为红色。

      下图所表示的是红黑树的一部分,需要注意节点25并非根节点。因为节点21和节点22连续出现了红色,不符合规则4,所以把节点22从红色变成黑色:

      B-树,B+树,红黑树的简单介绍

      但这样并不算完,因为凭空多出的黑色节点打破了规则5,所以发生连锁反应,需要继续把节点25从黑色变成红色:

      B-树,B+树,红黑树的简单介绍

      此时仍然没有结束,因为节点25和节点27又形成了两个连续的红色节点,需要继续把节点27从红色变成黑色:

      B-树,B+树,红黑树的简单介绍

  • 左旋转:

    • 逆时针旋转红黑树的两个节点,使得父节点被自己的右孩子取代,而自己成为自己的左孩子。说起来很怪异,大家看下图:​​​​​​​

    • B-树,B+树,红黑树的简单介绍

    • 图中,身为右孩子的Y取代了X的位置,而X变成了自己的左孩子。此为左旋转。

  • 右旋转:

    • ​​​​​​​顺时针旋转红黑树的两个节点,使得父节点被自己的左孩子取代,而自己成为自己的右孩子。大家看下图:
    • B-树,B+树,红黑树的简单介绍
    • 图中,身为左孩子的Y取代了X的位置,而X变成了自己的右孩子。此为右旋转。
  • 我们以刚才插入节点21的情况为例:

    B-树,B+树,红黑树的简单介绍

    首先,我们需要做的是变色,把节点25及其下方的节点变色:

    B-树,B+树,红黑树的简单介绍

    此时节点17和节点25是连续的两个红色节点,那么把节点17变成黑色节点?恐怕不合适。这样一来不但打破了规则4,而且根据规则2(根节点是黑色),也不可能把节点13变成红色节点。

    变色已无法解决问题,我们把节点13看做X,把节点17看做Y,像刚才的示意图那样进行左旋转:

    B-树,B+树,红黑树的简单介绍

    B-树,B+树,红黑树的简单介绍

    B-树,B+树,红黑树的简单介绍

    由于根节点必须是黑色节点,所以需要变色,变色结果如下:

    B-树,B+树,红黑树的简单介绍

    这样就结束了吗?并没有。因为其中两条路径(17 -> 8 -> 6 -> NIL)的黑色节点个数是4,其他路径的黑色节点个数是3,不符合规则5。

    这时候我们需要把节点13看做X,节点8看做Y,像刚才的示意图那样进行右旋转:

    B-树,B+树,红黑树的简单介绍

    B-树,B+树,红黑树的简单介绍

    B-树,B+树,红黑树的简单介绍

    最后根据规则来进行变色:

    B-树,B+树,红黑树的简单介绍

    如此一来,我们的红黑树变得重新符合规则。这一个例子的调整过程比较复杂,经历了如下步骤:

    变色 -> 左旋转 -> 变色 -> 右旋转 -> 变色