Treap（树堆）详解

2024-01-12 12:10:22

树堆(Treap)详解

本篇随笔详细讲解一下一种随机化数据结构——树堆（\(Treap\)）。

树堆的概念

首先给一个字符串等式：

\[Treap=Tree+heap \]

所以\(Treap\)树堆其实就是树+堆。树是二叉查找树\(BST\)，堆是二叉堆，大根堆小根堆都可以。
关于\(BST\)的相关知识，请看官走这边：

BST详解

树堆既是一棵二叉查找树，也是一个二叉堆。但是这两种数据结构貌似还是矛盾的存在，如果是二叉查找树，就不能是一个堆，如果是一个堆，那么必然不是二叉查找树。

所以树堆用了一个很巧妙的方式解决这个问题：给每个键值一个随机附加的优先级，让键值满足二叉查找树的结构，让优先级满足二叉堆的结构。

就像下面这个样子：（图片摘自腾讯云）

其中大写字母是键值，满足\(BST\)结构。数是优先级，满足小根堆结构。

树堆实现平衡树的特点

我们在\(BST\)中讲过，普通的\(BST\)具有很强的不确定性，如果数据特殊，建树的时候可能直接变成一条链。不仅如此，插入删除的时候也很麻烦。因为如果插入或者删除，整个树原来的结构就会被打乱，这会为遍历和查找带来灾难性的后果。

所以我们推出了平衡树。就是通过将树旋转来动态维护这个树形态是平衡的，这样查找的复杂度就是\(O(log)\)级别的，是一种稳定的复杂度。

树堆是一种平衡树，它通过为键值（也就是我们需要维护成\(BST\)的）赋予优先级，使之也满足堆结构来进行旋转，成为一棵平衡树。

但是我们需要注意一点：树堆的优先级是随机赋予的。也就是说，这个数据结构其实是一个随机化的数据结构。这不是树堆的缺点，因为只有随机化赋予优先级，才有可能保证树堆的复杂度是\(O(log)\)的级别。

那么，上述性质也说明了，树堆并不是一个规则形态的二叉树，更不是堆需要满足的完全二叉树。甚至它也不符合平衡树的定义：每个节点左右子树高度相差\(\le1\)，所以我们说树堆是近似实现平衡。

但是通过形态定义二叉树的方式并不绝对。我们换一种方式来对平衡树进行定义：

能够保证时间复杂度的\(BST\)，就是平衡树。

树堆的操作

首先当我们理解\(Treap\)的操作的时候，需要先对旋转这个事情有一个大体的定义。

上图：

光看这个箭头的话，还是很容易理解什么是旋转的。但是可能给读者造成困扰的是：这个B节点的父亲怎么变了？

原因是这样的：我们在进行旋转操作的时候，要保证\(BST\)的节点遍历顺序是一样的，而\(BST\)的节点遍历顺序是中序遍历（这个是按\(BST\)的定义来的），也就是说只有这样才能保证遍历序不变的情况下调换节点位置。

所以，针对这个图，我们把“P/F”看成一对节点，就能很好地理解这个“左/右旋”的操作了。

Treap的插入

首先我们了解一下\(BST\)的插入方式。其实很简单，就是一个新节点插进去，从根节点开始不停地与当前节点比大小，一直到这个节点成为叶子节点为止。

因为\(Treap\)要同时维护\(BST\)和堆，所以我们还需要在里面加上旋转操作。

如果是右儿子的话要左旋，左儿子要右旋（旋转操作请结合上图理解）。

然后我们又多统计了一个size的数据，这个数据表示子树大小，在统计当前数x是第几大的时候会很方便。

应该很简单。

struct node
{
    int val,pri,size,lson,rson;//val键值，pri优先级，size子树大小。
}tree[maxn];
int tot;
void L_rotate(int &pos)
{
    node x=tree[tree[pos].rson];//x表示要转到上面的节点
    tree[pos].rson=x.lson;
    x.lson=pos;
    x.size=tree[pos].size;
    maintain(pos);
    tree[pos]=x;
}
void R_rotate(int &pos)
{
    node x=tree[tree[pos].lson];
    tree[pos].lson=x.rson;
    x.size=tree[pos].size;
    maintain(pos);
    tree[pos]=x;
}
void maintain(int pos)
{
    tree[pos].size=tree[tree[pos].lson].size+tree[tree[pos].rson].size+1;
}
void insert(int &pos,int x)
{
    if(!pos)
    {
        pos=++tot;
        tree[pos].val=x;
        tree[pos].pri=rand();
    }
    if(x<tree[pos].val)
    {
        insert(tree[pos].lson,x);
        if(tree[pos].pri<tree[lson].pri)//如果优先级不匹配，就旋转(这里维护的是大根堆)
            R_rotate(pos);
    }
    else
    {
        insert(tree[pos].rson,x);
        if(tree[pos].pri<tree[rson].pri)
            L_rotate(pos);
    }
    maintain(pos);
}

Treap的删除

删除操作的大体思路和插入是一样的。也是要保证删除前后满足\(Treap\)的双重结构。

大致是这样的思路：首先找到这个点在哪。然后，如果这个点已经是叶子节点，就直接将其删除，如果不是，就一层层地将它转到底部，然后进行删除。这和我们的插入操作有异曲同工之妙，就是进行操作的一定是叶子节点，如果不是叶子的话是不能粗暴删除的。需要转。

void remove(int &pos,int x)
{
    if(!pos)
        return;
    if(x==tree[pos].val)
    {
        if(tree[pos].lson|tree[pos].rson)//如果非叶子节点
        {
            if(tree[tree[pos].lson].pri>tree[tree[pos].rson].pri)
                R_rotate(pos),remove(tree[pos].lson,x);
            else
                L_rotate(pos),remove(tree[pos].rson,x);
            maintain(pos);
        }
        else
            pos=0;
    }
    else
    {
        if(x<tree[pos].val)
            remove(tree[pos].lson,x);
        else
            remove(tree[pos].rson,x);
    }
    if(pos)
        maintain(pos);
}

Treap的查询（某数排名）

查询操作不涉及修改，根据树堆的双重性质，其操作是跟\(BST\)是一样的。

int rank(int pos,int x)
{
    if(!pos)
        return 1;
    if(x<tree[pos].val)
        return rank(tree[pos].lson,x);
    else
        return rank(tree[pos].rson,x)+tree[tree[pos].lson].size+1;
}
int rank(int pos,int x,int &cnt)
{
    if(!pos)
        return -1;
    if(x==tree[pos].val)
        return cnt+=tree[tree[pos].lson].size;
    else
    {
        if(x<tree[pos].val)
            rank(tree[pos].lson,x,cnt);
        else
            cnt+=(tree[tree[pos].lson].size+1),rank(tree[pos].rson,x,cnt);
    }
}

Treap的查询（第K大）

int kth(int pos,int k)
{
    if(!pos || k<=0 || k>tree[pos].size)
        return -1;
    if(k==tree[tree[pos].lson].size+1)
        return tree[pos].val;
    else if(k<=tree[tree[pos].lson].size)
        return kth(tree[pos].lson,k);
    else
        return kth(tree[pos].rson,k-tree[tree[pos].lson].size-1);
}

Treap的查询（前驱/后继）

#define INF 1e9
int prev(int pos,int x)
{
    if(!pos)
        return -INF;
    if(x<tree[pos].val)
        return prev(tree[pos].lson,x);
    else
        return max(tree[pos].val,prev(tree[pos].rson,x));
}
int nxt(int pos,int x)
{
    if(!pos)
        return INF;
    if(x>=tree[pos].val)
        return nxt(tree[pos].rson,x);
    else
        return min(tree[pos].val,nxt(tree[pos].lson,x));
}

Treap的遍历

Treap的遍历是中序遍历，遵循先左后右的原则。

void dfs(int pos)
{
    if(tree[pos].lson)
        dfs(tree[pos].lson);
    printf("%d ",tree[pos].val);
    if(tree[pos].rson)
        dfs(tree[pos].rson);
}

码农公寓