一、B树
特点
一个M阶的B树具有如下几个特征:(如下图 M=3)(下文的关键字可以理解为有效数据,而不是单纯的索引)
定义任意非叶子结点最多只有 M 个儿子,且 M>2
根结点的儿子数为[2, M]除根结点以外的非叶子结点的儿子数为[M/2, M],向上取整; (儿子数:[2,3])
非叶子结点的关键字个数=儿子数-1;(关键字=2)
所有叶子结点位于同一层
k 个关键字把节点拆成 k+1 段,分别指向 k+1 个儿子,同时满足查找树的大小关系。 (k=2)
有关B树的一些特性,注意与后面的B+树区分:
关键字集合分布在整棵树中
任何一个关键字出现且只出现在一个结点中
搜索有可能在非叶子节点结束
其搜索性能等价于在关键字全集内做一次二分查找;
二、B+树
特点
一个M阶的 B+ 树具有如下几个特征:
有 n 棵子树的非叶子结点中含有 n 个关键字(b 树是 n-1 个),这些关键字不保存数据, 只用来索引,所有数据都保存在叶子节点(b 树是每个关键字都保存数据)
所有的叶子结点中包含了全部关键字的信息,及指向含这些关键字记录的指针,且叶子 结点本身依关键字的大小自小而大顺序链接
所有的非叶子结点可以看成是索引部分,结点中仅含其子数中的最大(或最小)关键字
通常在 b+树上有两个头指针,一个指向根结点,一个指向关键字最小的叶子结点
同一个数字会在不同节点中重复出现,根节点的最大元素就是 b+树的最大元素
三、B*树
四、选用B+树作为数据库的索引结构的原因
1、B+树的中间节点不保存数据,是纯索引。但是 B 树的中间节点是保存数据和索引的,相对来说,B+树磁盘也能容纳更多节点元素,更“矮胖”B+树查询必须查找到叶子节点,
2、B树只要匹配到即可不用管元素位置,因此B+树查找更稳定(并不慢)
3、对于范围查找来说,B+树只需遍历叶子节点链表即可,B树却需要重复地中序遍历,在项目中范围查找又很是常见的。
4、增删文件(节点)时,效率更高,因为 B+树的叶子节点包含所有关键字,并以有序的链表结构存储,这样可很好提高增删效率
参考资料