2014.06.18 14:16
简介:
“并查集”,英文名为“union-find set”,从名字就能看出来它支持合并与查找功能。另外还有一个名字叫“disjoint set”,中文名叫不相交集合。可能我们倾向于用最短的名字,所以就出现了“并查集”翻译为“disjoint set”的情况。并查集是一种树形结构,但与之前讲的树不同的是,这里的树节点只记录父节点,因此是一对一的,就可以用数组来表示并查集。
图示:
并查集可以认为是一个“森林”,也就是多棵树:
既然是并查集,先看看合并3和5之后结果如何:
那么3和5岂不是父子关系了?不是。我们关心的不是谁是父谁是子,而是3和5现在在一起了。下面这样效果是一样的:
这个看起来不像树形结构啊?那就来个节点个数更多的例子:
再看看查找操作:
这样的查找操作不改变树的形状,自底向上,复杂度必然是O(H),也就是和树的高度成正比。有什么坏处呢?
路径压缩可以通过让树变得更扁来降低高度,从而加速查找操作。首先仍然是查找:
然后依次把沿路的所有节点直接挂到根节点上:
图片占的篇幅更少,显然是因为树变矮了。现在查找操作只需要O(1)时间了。
那么并查集有什么用呢?通俗地说,是用来判断一群人中,谁和谁是一伙儿的,谁和谁不是。不通俗地说,可以看看“等价关系”、“等价类”的一些集合论的资料,从中寻找一些理论支持。
在此给出一道用并查集解决的ZOJ简单题:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=2833
实现:
1 // My implementation for disjoint set. 2 #include <vector> 3 using namespace std; 4 5 int findRoot(const vector<int> &dj, int x) 6 { 7 int k, r; 8 9 r = x; 10 while (r != dj[r]) { 11 r = dj[r]; 12 } 13 14 k = x; 15 while (k != r) { 16 x = dj[x]; 17 dj[k] = r; 18 k = x; 19 } 20 21 return r; 22 } 23 24 void unionSet(vector<int> &dj, int x, int y) 25 { 26 int n = (int)dj.size(); 27 28 if (x == y) { 29 return; 30 } 31 32 dj[x] = y; 33 findRoot(x); 34 } 35 36 int main() 37 { 38 return 0; 39 }