前言
首先来讲。。。终于调出来了55555。。。调了整整3天。。。。。
看到大部分大佬都是用指针来实现的Splay。小的只是按照Splay的核心思想和原理来进行的。可能会有不妥之处,还请大佬们指出,谢谢!
那么这个题解存在的意义就是让不会敲Splay的人额。。。会敲Splay啦。。。
基本思想
数据结构
对于Splay,我定义了一个class类(当成struct就行啦。。。个人习惯不同啦),定义名称为“Splay”。
之后在类中,我定义了Splay的主体,即数组e。
e的类型是node类型,包含节点值(v)、父级节点(father)、左孩子(ch[0])、右孩子(ch[1])、包含自己在内的下面共有多少元素(sum)(注意是元素啊!!!不是节点!!!)、该节点所表示的元素出现的次数(recy)。
之后,还在类中定义了n代表当前已经使用的数组编号。points代表整个树总共有多少元素(注意是元素啊!!!不是节点!!!)。
另外,整棵树中,有一个超级根e[0],其右孩子即为树的根。
宏定义了e[0].ch[1]为root,方便访问、理解。并在类的末尾取消定义root,确保外部再定义root变量时不会出现问题,维持其模块性质。
class Splay//存储规则:小左大右,重复节点记录 { #define root e[0].ch[1] //该树的根节点 private: class node { public: int v,father;//节点值,父级节点 int ch[2];//左孩子=0,右孩子=1 int sum;//自己+自己下级有多少节点。在根节点为1。 int recy;//记录自己被重复了几次 }; node e[MAXL];//Splay树主体 int n,points;//使用存储数,元素数 …… #undef root };
功能全解
更新当前节点sum值(update)
就是在进行了连接、插入、删除等操作以后使用的一个维护性质的函数。用来确定被update的节点的sum值。
void update(int x) { e[x].sum=e[e[x].ch[0]].sum+e[e[x].ch[1]].sum+e[x].recy; }
获取父子关系(identify)
用来确定当前节点到底是父亲的左孩子(0)还是右孩子(1)。
int identify(int x) { return e[e[x].father].ch[0]==x?0:1; }
建立父子关系(connect)
用来连接两个点,其中一个点为另一个点的孩子。
注意,这个操作并不能将其他的父子关系一并断开。因为他们与被操作的两个点没有直接的数据联系。例如下图:
图表明尽管B的父亲已经不是x,但是x的右孩子依旧是B,没有被更新。因此使用过程中应当有更巧妙的设计来避免这样导致的错误发生。
void connect(int x,int f,int son)//连接函数。用法:connect(son,father,左儿子(0)或右儿子(1)) { e[x].father=f; e[f].ch[son]=x; }//作用:将x连接在f的下方。连接方向由son的值决定。
旋转节点(rotate)
着重注意的一个函数。这个函数同时实现了左旋和右旋。
所谓的旋转,其实就是指将被指定的节点向上移动一级,并将原有的父级节点作为自己的儿子。如下图:
我们可以通过下图原理论证来确定只需要三次connect即可完成旋转。
上图代表了右旋。
在图中,A、B、C代表三个子树(可以是空的),x和y代表被旋转的节点。R为y的上级节点,与旋转没有直接关系,但是它的右孩子要进行相应的改变。
在进行完connect函数后,再进行update函数即可完成旋转。
但是旋转总共有两种类型的操作(即左旋和右旋)。在这里,我们需要配合位运算直接达到自动判断和旋转方向决断的目的。
我们知道,对于任意一个自然数,与1进行逻辑异或运算,会得到这样的结果:
0^1=1 1^1=0 2^1=3 3^1=2 4^1=5 5^1=4 ……
也就是说,0对应1,2对应3,4对应5,向后依次推。
既然这样,那么我们的左右儿子节点所代表的编号分别是0和1。也就是说对其中一个取逻辑异或,会得到另一个儿子的标号(即对0取逻辑异或得1,对1取逻辑异或得0)。
通过左旋右旋的性质可以知道,实际改变了父子关系的节点是上图的:x、y、B节点。因为实际上,A、C节点的父子关系并没有发生任何改变。
并且我们能够注意到,x与y节点的连接方向一定是与x和B的连接方向不同的。
那么,我们只需要先通过“identify”函数确定x与y的父子关系,确定到底要向那一边旋转(如果x是y的左孩子,那么就向右旋转。如果x是y的右孩子,那么就向左旋转),然后通过逻辑异或来确定子树“B”究竟应当被连接在y的哪一侧。
void rotate(int x) { int y=e[x].father; int mroot=e[y].father; int mrootson=identify(y); int yson=identify(x); int B=e[x].ch[yson^1]; connect(B,y,yson);connect(y,x,(yson^1));connect(x,mroot,mrootson); update(y);update(x); }
伸展操作(Splay)
其实就是考虑上旋节点的方式。
在这里,一开始我使用了一种较为偷懒的旋转方式,即能向上旋转就向上旋转。并不考虑上面的状况到底怎样。
其实,标准的写法中,需要考虑两种情况。如下图:
为了防止造成误导,我将不再介绍直接上旋的操作。但事实上,无论是直接上旋还是先判断再上旋,都会有可能进化或者退化原本的树形结构。
我也曾举出过两种操作模式各自进化或者退化树的例子。但是根据交题情况,在洛谷的模板题中,直接上旋的速度更快。然而在湖南的一道省选题中,使用直接上旋的模式却直接导致超时(大概慢了10倍)。所以说在面对大数据的不确定因素下,还是应当选择考虑更多种情况,而不能图方便。
在这里,我的函数实现的操作是:将at节点旋转到to节点所在的位置。
void splay(int at,int to) { to=e[to].father; while(e[at].father!=to) { int up=e[at].father; if(e[up].father==to) rotate(at); else if(identify(up)==identify(at)) {//对应图中case1 rotate(up); rotate(at); } else {//对应图中case2 rotate(at); rotate(at); } } }
添加节点(crepoint)和摧毁节点(destroy)
这两个操作是在插入新元素和删除元素过程中使用的函数。
crepoint的作用是获得一个新的树存储位置,然后为这个存储空间写入基本的信息,并返回使用的存储位置编号。
destroy的作用则是使得一个节点完全失效,完全抹除节点信息,防止其他意外的发生。并且添加了一个小小的优化:如果被抹除的节点恰好是存储数组的当前最后一个元素,那么就对存储空间的使用数减1。
实际上,也可以通过一个队列来确定那些节点在中间被挖空了。但这样的操作不仅要牺牲一个O(log N)的时间复杂度,而且事实上并没有太大的用处,因为你开的数组大小一定能够满足极端情况(比如说所有操作都是插入)。
int crepoint(int v,int father) { n++; e[n].v=v; e[n].father=father; e[n].sum=e[n].recy=1; return n; }void destroy(int x) { e[x].v=e[x].ch[0]=e[x].ch[1]=e[x].sum=e[x].father=e[x].recy=0; if(x==n) n--; }
查找元素(find)
要实现的功能是找特定值是否在树中以及对应的节点编号。
很简单的实现方式。从根开始向下移动,如果要找的元素比当前节点小,那么就转到自己的左孩子。否则,就转向自己的右孩子,直到节点值等于要找的值。
如果在找到目标值之前,需要走的路已经无法再走(比如说现在到了5,要找的是3,应该往左走,但是5已经没有左孩子了),那么则查找失败,返回失败值(0)。如果查找成功,则返回节点对应的编号。
查找结束后,将被查找的节点旋转到根,以保证树的结构随机性。
int find(int v) { int now=root; while(true) { if(e[now].v==v) { splay(now,root); return now; } int next=v<e[now].v?0:1; if(!e[now].ch[next]) return 0; now=e[now].ch[next]; } }
建树(build)
建树的功能我并没有看懂大佬们的操作到底是什么意思。。。(我觉得应该是将Splay用作线段树的时候使用的功能)所以我写了一个没有上旋操作的insert函数。
首先,从根开始,向下寻找。如果要插入的元素已经在树中,那么将这个节点的recy加1即可。如果没有出现过,那么找一个合适的空的位置。找到位置后,调用crepoint函数,在数组中申请一个新的下标存储元素。
同时注意,在向下寻找的过程中,对被经过的点的sum值加1,因为如果经过这个点,代表要加的点肯定在自己下面,所以自己下面的元素个数加1。
int build(int v)//内部调用的插入函数,没有splay { points++; if(n==0)//特判无点状态 { root=1; crepoint(v,0); } else { int now=root; while(true)//向下找到一个空节点 { e[now].sum++;//自己的下级肯定增加了一个节点 if(v==e[now].v) { e[now].recy++; return now; } int next=v<e[now].v?0:1; if(!e[now].ch[next]) { crepoint(v,now); e[now].ch[next]=n; return n; } now=e[now].ch[next]; } } return 0; }
插入节点(push)
就是在进行完build操作以后,执行一次上旋操作,确保树的结构随机性。
void push(int v) { int add=build(v); splay(add,root); }
删除节点(pop)
将输入值对应的节点在树中移除。
进行这样的操作时,我一开始考虑的是通过逐层的rotate操作将要被删除的节点转到最下方,然后再删除,最后逐层向上改变路径上的sum值。但是考虑到这样的操作可能会一方面导致树的大幅度退化,另一方面相当于要进行两次O(log N)的时间复杂度操作,常数略大,可能会成为一颗定时炸弹。所以为了稳定,还是用了常规的方法:
首先将要删除的节点旋转到根节点的位置。
然后,判断情况:如果要被删除的节点(注意现在它在根的位置)没有左孩子,那么直接摧毁这个节点,并将它的右孩子变成根。
如果自己有左孩子,那么就先把左子树中值最大的元素旋转到根的左孩子位置,然后将根节点的右孩子变成根节点的左孩子的右孩子,然后摧毁节点,并将左孩子变成根。
原理还请读者自己考虑吧,根据二叉排序树的性质。。。
void pop(int v)//删除节点 { int deal=find(v); if(!deal) return; points--; if(e[deal].recy>1) { e[deal].recy--; e[deal].sum--; return; } if(!e[deal].ch[0]) { root=e[deal].ch[1]; e[root].father=0; } else { int lef=e[deal].ch[0]; while(e[lef].ch[1]) lef=e[lef].ch[1]; splay(lef,e[deal].ch[0]); int rig=e[deal].ch[1]; connect(rig,lef,1);connect(lef,0,1); update(lef); } destroy(deal); }
获取元素的排名(rank)&获取该排名对应的元素值(atrank)
两个函数是互逆的函数。
rank的实现根find差不多,只是在向下走的时候,对于当前已经记录的rank值进行更新(每次调用rank时都初始化为0)。规则是:向左走时,rank值不发生任何改变。向右走之前,要先给rank加上当前节点的左孩子的sum值和recy值。找到对应元素时,再对rank+1。如下图:
atrank函数根rank实现完全相反。在向下走的过程中,如果要找的排名大于当前点左子树的sum值,并且小于等于当前点的左子树的sum加上本节点的recy的值,那么当前的点就是要找的点。如果小于上述范围,就往左走,反之向右。注意向右走的过程中,将要查询的排名值减少上述范围的最大值。
两个操作结束后,都要将被操作的节点旋转到根。
int rank(int v)//获取值为v的元素在这棵树里是第几小 { int ans=0,now=root; while(true) { if(e[now].v==v) return ans+e[e[now].ch[0]].sum+1; if(now==0) return 0; if(v<e[now].v) now=e[now].ch[0]; else { ans=ans+e[e[now].ch[0]].sum+e[now].recy; now=e[now].ch[1]; } } if(now) splay(now,root); return 0; }int atrank(int x)//获取第x小的元素的值 { if(x>points) return -INF; int now=root; while(true) { int minused=e[now].sum-e[e[now].ch[1]].sum; if(x>e[e[now].ch[0]].sum&&x<=minused) break; if(x<minused) now=e[now].ch[0]; else { x=x-minused; now=e[now].ch[1]; } } splay(now,root); return e[now].v; }
查找前驱(lower)和后继(upper)
两种操作是类似的操作。
前驱是指在树中,小于这个值并且最接近这个值的元素值。
后继则是大于这个值并且最接近这个值的元素值。
对于这两种函数的实现方式,就是先初始化一个最值,然后在向下走的过程中,如果发现了符合要求且更优的值,就用更优值替换当前的值。最后不能走的时候输出这个值即可。
int upper(int v) { int now=root; int result=INF; while(now) { if(e[now].v>v&&e[now].v<result) result=e[now].v; if(v<e[now].v) now=e[now].ch[0]; else now=e[now].ch[1]; } return result; }int lower(int v) { int now=root; int result=-INF; while(now) { if(e[now].vresult) result=e[now].v; if(v>e[now].v) now=e[now].ch[1]; else now=e[now].ch[0]; } return result; }
完整源代码
下面贴出完整源代码,方便交流分享!
1 #include 2 #include 3 #include 4 using namespace std; 5 6 const int MAXL=100005; 7 const int INF=2147480000; 8 9 class Splay//存储规则:小左大右,重复节点记录 10 { 11 #define root e[0].ch[1] //该树的根节点 12 private: 13 class node 14 { 15 public: 16 int v,father;//节点值,父级节点 17 int ch[2];//左孩子=0,右孩子=1 18 int sum;//自己+自己下级有多少节点。在根节点为1。 19 int recy;//记录自己被重复了几次 20 }; 21 node e[MAXL];//Splay树主体 22 int n,points;//使用存储数,元素数 23 void update(int x) 24 { 25 e[x].sum=e[e[x].ch[0]].sum+e[e[x].ch[1]].sum+e[x].recy; 26 } 27 int identify(int x) 28 { 29 return e[e[x].father].ch[0]==x?0:1; 30 } 31 void connect(int x,int f,int son)//连接函数。用法:connect(son,father,1/0) 32 { 33 e[x].father=f; 34 e[f].ch[son]=x; 35 }//作用:使得x的father=f,f的son=x. 36 void rotate(int x) 37 { 38 int y=e[x].father; 39 int mroot=e[y].father; 40 int mrootson=identify(y); 41 int yson=identify(x); 42 int B=e[x].ch[yson^1]; 43 connect(B,y,yson);connect(y,x,(yson^1));connect(x,mroot,mrootson); 44 update(y);update(x); 45 } 46 void splay(int at,int to)//将at位置的节点移动到to位置 47 { 48 to=e[to].father; 49 while(e[at].father!=to) 50 { 51 int up=e[at].father; 52 if(e[up].father==to) rotate(at); 53 else if(identify(up)==identify(at)) 54 { 55 rotate(up); 56 rotate(at); 57 } 58 else 59 { 60 rotate(at); 61 rotate(at); 62 } 63 } 64 } 65 int crepoint(int v,int father) 66 { 67 n++; 68 e[n].v=v; 69 e[n].father=father; 70 e[n].sum=e[n].recy=1; 71 return n; 72 } 73 void destroy(int x)//pop后摧毁节点 74 { 75 e[x].v=e[x].ch[0]=e[x].ch[1]=e[x].sum=e[x].father=e[x].recy=0; 76 if(x==n) n--;//最大限度优化 77 } 78 public: 79 int getroot(){return root;} 80 int find(int v)//用于外部的find调用 81 { 82 int now=root; 83 while(true) 84 { 85 if(e[now].v==v) 86 { 87 splay(now,root); 88 return now; 89 } 90 int next=v<e[now].v?0:1; 91 if(!e[now].ch[next]) return 0; 92 now=e[now].ch[next]; 93 } 94 } 95 int build(int v)//内部调用的插入函数,没有splay 96 { 97 points++; 98 if(n==0)//特判无点状态 99 {100 root=1;101 crepoint(v,0);102 }103 else104 {105 int now=root;106 while(true)//向下找到一个空节点 107 {108 e[now].sum++;//自己的下级肯定增加了一个节点 109 if(v==e[now].v)110 {111 e[now].recy++;112 return now;113 }114 int next=v<e[now].v?0:1;115 if(!e[now].ch[next])116 {117 crepoint(v,now);118 e[now].ch[next]=n;119 return n;120 }121 now=e[now].ch[next];122 }123 }124 return 0;125 }126 void push(int v)//插入元素时,先添加节点,再进行伸展 127 {128 int add=build(v);129 splay(add,root);130 }131 void pop(int v)//删除节点 132 {133 int deal=find(v);134 if(!deal) return;135 points--;136 if(e[deal].recy>1)137 {138 e[deal].recy--;139 e[deal].sum--;140 return;141 }142 if(!e[deal].ch[0])143 {144 root=e[deal].ch[1];145 e[root].father=0;146 }147 else148 {149 int lef=e[deal].ch[0];150 while(e[lef].ch[1]) lef=e[lef].ch[1];151 splay(lef,e[deal].ch[0]);152 int rig=e[deal].ch[1];153 connect(rig,lef,1);connect(lef,0,1);154 update(lef);155 }156 destroy(deal);157 }158 int rank(int v)//获取值为v的元素在这棵树里是第几小 159 {160 int ans=0,now=root;161 while(true)162 {163 if(e[now].v==v) return ans+e[e[now].ch[0]].sum+1;164 if(now==0) return 0;165 if(v<e[now].v) now=e[now].ch[0];166 else167 {168 ans=ans+e[e[now].ch[0]].sum+e[now].recy;169 now=e[now].ch[1];170 }171 }172 if(now) splay(now,root);173 return 0;174 }175 int atrank(int x)//获取第x小的元素的值 176 {177 if(x>points) return -INF;178 int now=root;179 while(true)180 {181 int minused=e[now].sum-e[e[now].ch[1]].sum;182 if(x>e[e[now].ch[0]].sum&&x<=minused) break;183 if(x<minused) now=e[now].ch[0];184 else185 {186 x=x-minused;187 now=e[now].ch[1];188 }189 }190 splay(now,root);191 return e[now].v;192 }193 int upper(int v)//寻找该值对应的一个最近的上界值 194 {195 int now=root;196 int result=INF;197 while(now)198 {199 if(e[now].v>v&&e[now].v<result) result=e[now].v;200 if(v<e[now].v) now=e[now].ch[0];201 else now=e[now].ch[1];202 }203 return result;204 }205 int lower(int v)//寻找该值对应的一个最近的下界值 206 {207 int now=root;208 int result=-INF;209 while(now)210 {211 if(e[now].vresult) result=e[now].v;212 if(v>e[now].v) now=e[now].ch[1];213 else now=e[now].ch[0];214 }215 return result;216 }217 #undef root218 };219 Splay F;220 221 int main()222 {223 224 return 0;225 }
后记
总算是讲完了如何实现最基础的Splay排序树。
可能会有大佬感觉:明明是来做题的了,怎么会有不懂Splay的呢?这不纯粹是装逼么?而且一点水平也没有,纯粹瞎扯淡!
我只能说,我刚开始学Splay的时候,就是一点一点的寻找相关资料的。包括从这道模板题找。但是系统讲解的还真没多少。而且贴出来的示例代码比较复杂,表示弱鸡看不懂。。。所以在钻研以后,写下了这篇文章。这些是我对Splay的理解。我将他们变成了书面的东西去分享给大家,希望大家能够从中受益,希望能够帮到更多正在努力学习平衡树的OIERS。如果有问题,也可以提出来,帮助我改进。