并查集是什么
并查集是一种用来管理元素分组情况的数据结构。并查集可以高效地进行如下操作。不过需要注意并查集虽然可以进行合并操作,但是却无法进行分割操作
- 查询元素a和元素b是否属于同一组
-
合并元素a和元素b所在的组
并查集的结构
并查集也是使用树形结构实现的,不过不是二叉树。
每个元素对应一个节点,每个组对应一棵树。在并查集中,哪个节点是哪个节点的父亲以及树的形状等信息无需多家关注,整体组成一个树形结构才是重要的。
(1)初始化
我们准备n个节点来表示n个元素。最开始时没有边。
(2)合并
像下图一样,从一个组的根向另一个组的根连边,这样两棵树就变成了一棵树,也就是把两个组合并为了一个组。
(3)查询
为了查询两个节点是否属于同一组,我们需要沿着树向上走,来查询包含这个元素的树的根是谁。如果两个节点走到了同一个根,那么就可以知道他们属于同一组。
在下图,2和5都走到了1,因此他们为同一组。另一方面,由于7走到的是6,因此与2和5属于不同组
并查集实现中的注意点
在树形数据结构中,如果发生了退化的情况,那么复杂度就会变得很高。因此有必要避免退化
- 对于每棵树,记录这棵树的高度(rank)
-
合并时如果两个数的rank不同,那么从rank小的向rank大的连边。
此外,通过路径压缩,可以使得并查集更加高效。对于每个节点,一旦向上走到了一次根节点,就把这个点到父亲的边改为直接连向根。
在此之上,不仅仅是所查询的节点,在查询过程中向上经过的所有节点,都改为直接连到根上。这样再次查询这些节点时,就可以很快知道根是谁了。
并查集的复杂度
并查集的实现
下面是并查集的实现的例子。在例子中,用编号代表每个元素,数组par表示的是父亲的编号,par[x]=x时,x是所在的树的根
int par[MAX_N];//父亲
int rank[MAX_N];//树的高度
//初始化n个元素
void init(int n){
for(int i=0;i<n;i++){
par[i]=i;
rank[i]=0;
}
}
//查询树的根
int find(int x){
if(par[x]==x)
return x;
else
return par[x]=find(par[x]);
}
//合并x和y所属的集合
void unite(int x,int y){
x=find(x);
y=find(y);
if(x==y)
return;
if(rank[x]<rank[y]){
par[x]=y
}else{
par[y]=x;
if(rank[x]==rank[y])
rank[x]++;
}
}
//判断x和y是否属于同一个集合
bool same(int x,int y){
return find(x)==find(y);
}
参考资料:并查集 - 简书