Treap(树堆)详解

树堆(Treap)详解

本篇随笔详细讲解一下一种随机化数据结构——树堆(\(Treap\))。

树堆的概念

首先给一个字符串等式:

\[Treap=Tree+heap \]

所以\(Treap\)树堆其实就是树+堆。树是二叉查找树\(BST\),堆是二叉堆,大根堆小根堆都可以。
关于\(BST\)的相关知识,请看官走这边:

BST详解

树堆既是一棵二叉查找树,也是一个二叉堆。但是这两种数据结构貌似还是矛盾的存在,如果是二叉查找树,就不能是一个堆,如果是一个堆,那么必然不是二叉查找树。

所以树堆用了一个很巧妙的方式解决这个问题:给每个键值一个随机附加的优先级,让键值满足二叉查找树的结构,让优先级满足二叉堆的结构。

就像下面这个样子:(图片摘自腾讯云)

Treap(树堆)详解

其中大写字母是键值,满足\(BST\)结构。数是优先级,满足小根堆结构。

树堆实现平衡树的特点

我们在\(BST\)中讲过,普通的\(BST\)具有很强的不确定性,如果数据特殊,建树的时候可能直接变成一条链。不仅如此,插入删除的时候也很麻烦。因为如果插入或者删除,整个树原来的结构就会被打乱,这会为遍历和查找带来灾难性的后果。

所以我们推出了平衡树。就是通过将树旋转来动态维护这个树形态是平衡的,这样查找的复杂度就是\(O(log)\)级别的,是一种稳定的复杂度。

树堆是一种平衡树,它通过为键值(也就是我们需要维护成\(BST\)的)赋予优先级,使之也满足堆结构来进行旋转,成为一棵平衡树。

但是我们需要注意一点:树堆的优先级是随机赋予的。也就是说,这个数据结构其实是一个随机化的数据结构。这不是树堆的缺点,因为只有随机化赋予优先级,才有可能保证树堆的复杂度是\(O(log)\)的级别。

那么,上述性质也说明了,树堆并不是一个规则形态的二叉树,更不是堆需要满足的完全二叉树。甚至它也不符合平衡树的定义:每个节点左右子树高度相差\(\le1\),所以我们说树堆是近似实现平衡

但是通过形态定义二叉树的方式并不绝对。我们换一种方式来对平衡树进行定义:

能够保证时间复杂度的\(BST\),就是平衡树。

树堆的操作

首先当我们理解\(Treap\)的操作的时候,需要先对旋转这个事情有一个大体的定义。

上图:

Treap(树堆)详解

光看这个箭头的话,还是很容易理解什么是旋转的。但是可能给读者造成困扰的是:这个B节点的父亲怎么变了?

原因是这样的:我们在进行旋转操作的时候,要保证\(BST\)的节点遍历顺序是一样的,而\(BST\)的节点遍历顺序是中序遍历(这个是按\(BST\)的定义来的),也就是说只有这样才能保证遍历序不变的情况下调换节点位置。

所以,针对这个图,我们把“P/F”看成一对节点,就能很好地理解这个“左/右旋”的操作了。

Treap的插入

首先我们了解一下\(BST\)的插入方式。其实很简单,就是一个新节点插进去,从根节点开始不停地与当前节点比大小,一直到这个节点成为叶子节点为止。

因为\(Treap\)要同时维护\(BST\)和堆,所以我们还需要在里面加上旋转操作。

如果是右儿子的话要左旋,左儿子要右旋(旋转操作请结合上图理解)。

然后我们又多统计了一个size的数据,这个数据表示子树大小,在统计当前数x是第几大的时候会很方便。

应该很简单。

struct node
{
    int val,pri,size,lson,rson;//val键值,pri优先级,size子树大小。
}tree[maxn];
int tot;
void L_rotate(int &pos)
{
    node x=tree[tree[pos].rson];//x表示要转到上面的节点
    tree[pos].rson=x.lson;
    x.lson=pos;
    x.size=tree[pos].size;
    maintain(pos);
    tree[pos]=x;
}
void R_rotate(int &pos)
{
    node x=tree[tree[pos].lson];
    tree[pos].lson=x.rson;
    x.size=tree[pos].size;
    maintain(pos);
    tree[pos]=x;
}
void maintain(int pos)
{
    tree[pos].size=tree[tree[pos].lson].size+tree[tree[pos].rson].size+1;
}
void insert(int &pos,int x)
{
    if(!pos)
    {
        pos=++tot;
        tree[pos].val=x;
        tree[pos].pri=rand();
    }
    if(x<tree[pos].val)
    {
        insert(tree[pos].lson,x);
        if(tree[pos].pri<tree[lson].pri)//如果优先级不匹配,就旋转(这里维护的是大根堆)
            R_rotate(pos);
    }
    else
    {
        insert(tree[pos].rson,x);
        if(tree[pos].pri<tree[rson].pri)
            L_rotate(pos);
    }
    maintain(pos);
}

Treap的删除

删除操作的大体思路和插入是一样的。也是要保证删除前后满足\(Treap\)的双重结构。

大致是这样的思路:首先找到这个点在哪。然后,如果这个点已经是叶子节点,就直接将其删除,如果不是,就一层层地将它转到底部,然后进行删除。这和我们的插入操作有异曲同工之妙,就是进行操作的一定是叶子节点,如果不是叶子的话是不能粗暴删除的。需要转。

void remove(int &pos,int x)
{
    if(!pos)
        return;
    if(x==tree[pos].val)
    {
        if(tree[pos].lson|tree[pos].rson)//如果非叶子节点
        {
            if(tree[tree[pos].lson].pri>tree[tree[pos].rson].pri)
                R_rotate(pos),remove(tree[pos].lson,x);
            else
                L_rotate(pos),remove(tree[pos].rson,x);
            maintain(pos);
        }
        else
            pos=0;
    }
    else
    {
        if(x<tree[pos].val)
            remove(tree[pos].lson,x);
        else
            remove(tree[pos].rson,x);
    }
    if(pos)
        maintain(pos);
}

Treap的查询(某数排名)

查询操作不涉及修改,根据树堆的双重性质,其操作是跟\(BST\)是一样的。

int rank(int pos,int x)
{
    if(!pos)
        return 1;
    if(x<tree[pos].val)
        return rank(tree[pos].lson,x);
    else
        return rank(tree[pos].rson,x)+tree[tree[pos].lson].size+1;
}
int rank(int pos,int x,int &cnt)
{
    if(!pos)
        return -1;
    if(x==tree[pos].val)
        return cnt+=tree[tree[pos].lson].size;
    else
    {
        if(x<tree[pos].val)
            rank(tree[pos].lson,x,cnt);
        else
            cnt+=(tree[tree[pos].lson].size+1),rank(tree[pos].rson,x,cnt);
    }
}

Treap的查询(第K大)

int kth(int pos,int k)
{
    if(!pos || k<=0 || k>tree[pos].size)
        return -1;
    if(k==tree[tree[pos].lson].size+1)
        return tree[pos].val;
    else if(k<=tree[tree[pos].lson].size)
        return kth(tree[pos].lson,k);
    else
        return kth(tree[pos].rson,k-tree[tree[pos].lson].size-1);
}

Treap的查询(前驱/后继)

#define INF 1e9
int prev(int pos,int x)
{
    if(!pos)
        return -INF;
    if(x<tree[pos].val)
        return prev(tree[pos].lson,x);
    else
        return max(tree[pos].val,prev(tree[pos].rson,x));
}
int nxt(int pos,int x)
{
    if(!pos)
        return INF;
    if(x>=tree[pos].val)
        return nxt(tree[pos].rson,x);
    else
        return min(tree[pos].val,nxt(tree[pos].lson,x));
}

Treap的遍历

Treap的遍历是中序遍历,遵循先左后右的原则。

void dfs(int pos)
{
    if(tree[pos].lson)
        dfs(tree[pos].lson);
    printf("%d ",tree[pos].val);
    if(tree[pos].rson)
        dfs(tree[pos].rson);
}
上一篇:HW2.22


下一篇:Javascript动态生成表格的性能调优