红黑树的规则:
- 每个结点不是红⾊就是⿊⾊
- 根结点是⿊⾊的
- 如果⼀个结点是红⾊的,则它的两个孩⼦结点必须是⿊⾊的,也就是说任意⼀条路径不会有连续的红⾊结点。
- 对于任意⼀个结点,从该结点到其所有NULL结点的简单路径上,均包含相同数量的黑色结点
思考⼀下,红黑树如何确保最长路径不超过最短路径的2倍的?
- 由规则4可知,从根到NULL结点的每条路径都有相同数量的黑色结点,所以极端场景下,最短路径就就是全是黑色结点的路径,假设最短路径长度为bh(black height)
- 由规则2和规则3可知,任意⼀条路径不会有连续的红色结点,所以极端场景下,最长的路径就是一黑一红间隔组成,那么最长路径的长度为2*bh
- 综合红黑树的4点规则而言,理论上的全黑最短路径和一黑一红的最长路径并不是在每棵红黑树都存在的。假设任意⼀条从根到NULL结点路径的⻓度为x,那么bh <= h <= 2*bh。
红黑树的效率:
简单概括:接近于完全二叉树;再加上,计算机处理速度极快,相差的几十几百次可以忽略。
假设N是红黑树树中结点数量,h最短路径的长度,那么2^h - 1 <= N < 2^(2∗h) - 1, 由此推出h ≈ logN,也就是意味着红黑树增删查改最坏也就是走最长路径 ,那么时间复杂度还是 O(logN)。
AVL于红黑树
- 红黑树的表达相对AVL树要抽象⼀些。
- AVL树通过高度差直观的控制了平衡。红黑树通过4条规则的颜⾊约束,间接的实现了近似平衡。
- 他们效率都是同⼀档次,但是相对而言,插入相同数量的结点,红黑树的旋转次数是更少的,因为他对平衡的控制没那么严格。
红黑树的结构
// 枚举值表⽰颜⾊ enum Color { Red, Black }; // 这⾥我们默认按key/value结构实现 template<class K, class V> struct RBTreeNode { // 这⾥更新控制平衡也要加⼊parent指针 Color _col; pair<K, V> _kv; RBTreeNode<K, V>* _right; RBTreeNode<K, V>* _left; RBTreeNode<K, V>* _parent; RBTreeNode(pair<K, V> kv) :_kv(kv) ,_right(nullptr) ,_left(nullptr) ,_parent(nullptr) {} }; template<class K, class V> class RBTree { typedef RBTreeNode<K, V> Node; public: ……………… private: Node* _root = nullptr }
红黑树树插入⼀个值的大概过程
- 插⼊⼀个值按⼆叉搜索树规则进⾏插⼊,插⼊后我们只需要观察是否符合红⿊树的4条规则。
- 如果是空树插入,新增结点是黑色结点。
- 如果是非空树插入,新增结点必须红色结点,因为⾮空树插⼊,新增⿊⾊结点就破坏了规则4,规则4是很难维护的。(会通过变色, 旋转维护,后面会说)
- ⾮空树插⼊后,新增结点必须红色结点,如果父亲结点是黑色的,则没有违反任何规则,插⼊结束(循环)
- ⾮空树插⼊后,新增结点必须红色结点,如果父亲结点是红色的,则违反规则3。进⼀步分析,c是红色,p为红,g必为黑,这三个颜色都固定了,关键的变化看u的情况,需要根据u分为以下⼏种情况分别处理
说明:下图中假设我们把新增结点标识为c (cur),c的⽗亲标识为p(parent),p的⽗亲标识为g(grandfather),p的兄弟标识为u(uncle)。
情况1:变色
c为红,p为红,g为⿊,u存在且为红,则将p和u变⿊,g变红。在把g当做新的c,继续往上更新。
分析:
- 因为p和u都是红色,g是黑色,把p和u变黑,左边⼦树路径各增加⼀个黑色结点,g再变红,相当于保持g所在子树的黑色结点的数量不变,同时解决了c和p连续红色结点的问题。
- 需要继续往上更新是因为,g是红色,如果g的父亲还是红色,那么就还需要继续处理;如果g的⽗亲是黑色,则处理结束了;如果g就是整棵树的根,再把g变回黑色。
情况1只变色,不旋转。所以无论c是p的左还是右,p是g的左还是右,都是上面的变色处理方式。
- 跟AVL树类似,下图我们展示了⼀种具体情况,但是实际中需要这样处理的有很多种情况。
- 下图将以上类似的处理进行了抽象表达,d/e/f代表每条路径拥有hb个黑色结点的子树,a/b代表每条路径拥有hb-1个黑色结点的根为红的子树,hb>=0。
- 下图分别展示了hb == 0/hb == 1/hb == 2的具体情况组合分析,当hb等于2时,这里组合情况上百亿种,这些样例是帮助我们理解,不论情况多少种,多么复杂,处理方式一样的,变色再继续往上处理即可,所以我们只需要看抽象图即可。
情况2:单旋+变色
c为红,p为红,g为黑,u不存在或者u存在且为黑,u不存在,则c一定是新增结点,u存在且为黑,则c一定不是新增,c之前是黑色的,是在c的子树中插⼊,符合情况1,变⾊将c从黑色变成红色,更新上来的。
分析:
- p必须变黑,才能解决,连续红色结点的问题,u不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转+变色。
- 如果p是g的左,c是p的左,那么以g为旋转点进行右单旋,再把p变黑,g变红即可。p变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为p的父亲是黑色还是红色或者空都不违反规则。
- 如果p是g的右,c是p的右,那么以g为旋转点进行左单旋,再把p变黑,g变红即可。p变成课这颗树新的根,这样⼦树黑色结点的数量不变,没有连续的红色结点了,且不需要往上更新,因为p的父亲是黑色还是红色或者空都不违反规则。
图解:
情况3:双旋+变色
c为红,p为红,g为黑,u不存在或者u存在且为黑,u不存在,则c一定是新增结点,u存在且为黑,则c⼀定不是新增,c之前是黑色的,是在c的子树中插入,符合情况1,变色将c从黑色变成红色,更新上来的。
分析:
- p必须变黑,才能解决,连续红色结点的问题,u不存在或者是黑色的,这里单纯的变色无法解决问题,需要旋转+变色。
- 如果p是g的左,c是p的右,那么先以p为旋转点进行左单旋,再以g为旋转点进行右单旋,再把c变黑,g变红即可。c变成课这颗树新的根,这样子树黑色结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的父亲是黑色还是红色或者空都不违反规则。
- 如果p是g的右,c是p的左,那么先以p为旋转点进行右单旋,再以g为旋转点进行左单旋,再把c变黑,g变红即可。c变成课这颗树新的根,这样⼦树⿊⾊结点的数量不变,没有连续的红⾊结点了,且不需要往上更新,因为c的⽗亲是黑色还是红色或者空都不违反规则。
图标解析:
红黑树的插入代码实现
bool Insert(pair<K, V> kv)
{
if (_root == nullptr)
{
_root = new Node(kv);
return true;
}
Node* parent = nullptr;
Node* cur = _root;
while (cur)
{
if (cur->_kv.first > kv.first)
{
parent = cur;
cur = cur->_left;
}
else if (cur->_kv.first < kv.first)
{
parent = cur;
cur = cur->_right;
}
else {
return false;
}
}
cur = new Node(kv);
cur->_col = Red;
if (cur->_kv.first > parent->_kv.first)
{
parent->_right = cur;
}
else
{
parent->_left = cur;
}
cur->_parent = parent;
// 父亲是红色,出现连续的红色节点,需要处理
while (parent && parent->_col == Red)
{
Node* grandfather = parent->_parent;
// g
// p u
if (grandfather->_left == parent)
{
// g
// p u
Node* uncle = grandfather->_right;
if (uncle && uncle->_col == Red)
{
//改色
parent->_col = Black;
uncle->_col = Black;
grandfather->_col = Red;
//循环
cur = grandfather;
parent = cur->_parent;
}
else
{
if (cur == parent->_left)
{
// g
// p u
// c
RotateR(grandfather);
parent->_col = Black;
grandfather->_col = Red;
}
else if (cur == parent->_right)
{
// g
// p u
// c
RotateL(parent);
RotateR(grandfather);
parent->_col = Black;
grandfather->_col = Red;
}
//这种情况 p 是直接是黑 肯定是已经满足要求了
break;
}
}
else if (grandfather->_right == cur->_parent)
{
// g
// u p
Node* uncle = grandfather->_left;
if (uncle && uncle->_col == Red)
{
//改色
parent->_col = Black;
uncle->_col = Black;
grandfather->_col = Red;
//循环
cur = grandfather;
parent = cur->_parent;
}
else
{
if (cur == parent->_right)
{
// g
// u p
// c
RotateL(grandfather);
parent->_col = Black;
grandfather->_col = Red;
}
else if (cur == parent->_left)
{
// g
// u p
// c
RotateR(parent);
RotateL(grandfather);
cur->_col = Black;
grandfather->_col == Red;
}
//_root->_col = Black;
//这种情况 p 是直接是黑 肯定是已经满足要求了
break;
}
}
}
_root->_col = Black;
return true;
}
void RotateL(Node* grand)
{
Node* subR = grand->_right;
Node* subRL = subR->_left;
Node* pparent = grand->_parent;
if (grand == _root)
{
_root = subR;
subR->_parent = nullptr;
}
else {
//subR节点
if (pparent->_left == grand)
{
pparent->_left = subR;
}
else {
pparent->_right = subR;
}
subR->_parent = pparent;
}
//parent 节点
subR->_left = grand;
subRL->_parent = grand;
grand->_right = subRL;
grand->_parent = subR;
//subR->_col = Black;
//grand->_col = Red;
}
void RotateR(Node* grand)
{
Node* subL = grand->_left;
Node* subLR = subL->_right;
Node* pparent = grand->_parent;
if (grand == _root)
{
_root = subL;
subL->_parent = nullptr;
}
else {
//subR节点
if (pparent->_left == grand)
{
pparent->_left = subL;
}
else {
pparent->_right = subL;
}
subL ->_parent = pparent;
}
//parent 节点
subL->_right = grand;
subLR->_parent = grand;
grand->_left = subLR;
grand->_parent = subL;
//subL->_col = Black;
//grand->_col = Red;
}
红黑树的验证
注意:
- 这⾥获取最⻓路径和最短路径,检查最⻓路径不超过最短路径的2倍是不可⾏的,因为就算满⾜这个条件,红⿊树也可能颜⾊不满⾜规则,当前暂时没出问题,后续继续插⼊还是会出问题的。
所以我们还是去检查4点规则,满⾜这4点规则,⼀定能保证最⻓路径不超过最短路径的2倍。
- 规则1枚举颜⾊类型,天然实现保证了颜⾊不是⿊⾊就是红⾊。
- 规则2直接检查根即可
- 规则3前序遍历检查,遇到红⾊结点查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲的颜⾊就⽅便多了。
- 规则4前序遍历,遍历过程中⽤形参记录跟到当前结点的blackNum(⿊⾊结点数量),前序遍历遇到⿊⾊结点就++blackNum,⾛到空就计算出了⼀条路径的⿊⾊结点数量。再任意⼀条路径⿊⾊结点数量作为参考值,依次⽐较即可。
参考代码:
bool Check(Node* root, int blackNum, const int refNum)
{
if (root == nullptr)
{
if (blackNum == refNum)
return true;
else
{
cout << "存在⿊⾊结点的数量不相等的路径" << endl;
return false;
}
}
// 检查孩⼦不太⽅便,因为孩⼦有两个,且不⼀定存在,反过来检查⽗亲就⽅便多了
if (root->_col == Red && root->_parent->_col != Red)
{
return false;
}
if(root->_col == BLACK)
{
blackNum++;
}
return Check(root->_left, blackNum, refNum) && Check(root->_right, blackNum, refNum);
}
bool IsBalance()
{
//特殊情况不要忘记
if (_root == nullptr)
{
return true;
}
if (_root->_col == Red)
{
return false;
}
int refNum = 0;
Node* cur = _root;
while (cur)
{
if (cur->_col == Black)
{
refNum++;
}
cur = cur->_left;
}
return Check(_root, 0, refNum);
}
红黑树的删除
有兴趣的朋友可参考:《算法导论》或者《STL源码剖析》中的讲解。