贪心算法(2)-Kruskal最小生成树

什么是最小生成树?

生成树是相对图来说的,一个图的生成树是一个树并把图的所有顶点连接在一起。一个图可以有许多不同的生成树。一个有 n 个结点的连通图的生成树是原图的极小连通子图,且包含原图中的所有 n 个结点,并且有保持图连通的最少的边。最小生成树其实是最小权重生成树的简称。生成树的权重是考虑到了生成树的每条边的权重的总和。

最小生成树有几条边?

最小生成树有(V – 1)条边,其中V是给定的图的顶点数量。

Kruskal算法

下面是步骤寻找MST使用Kruskal算法

1 1,按照所有边的权重排序(从小到大)
2  
3 2,选择最小的边。检查它是否形成与当前生成树形成环。如果没有形成环,讲这条边加入生成树。否则,丢弃它。 
4  
5 3,重复第2步,直到有生成树(V-1)条边

步骤2使用并查集算法来检测环。如果不熟悉并查集建议阅读下并查集

该算法是一种贪心算法。贪心的选择是选择最小的权重的边,并不会和当前的生成树形成环。让我们了解一个例子,考虑下面输入图

贪心算法(2)-Kruskal最小生成树

spanning-tree-mst

该图包含9个顶点和14个边。因此,形成最小生成树将有(9 – 1)= 8条边。

01 排序后:
02 Weight   Src    Dest
03 1         7      6
04 2         8      2
05 2         6      5
06 4         0      1
07 4         2      5
08 6         8      6
09 7         2      3
10 7         7      8
11 8         0      7
12 8         1      2
13 9         3      4
14 10        5      4
15 11        1      7
16 14        3      5

现在从已经排序的边中逐个选择
1. edge 7-6:没有环,加入
贪心算法(2)-Kruskal最小生成树

2. edge 8-2: 没有环,加入
贪心算法(2)-Kruskal最小生成树

3. edge 6-5: 没有环,加入
贪心算法(2)-Kruskal最小生成树

4. edge 0-1: 没有环,加入
贪心算法(2)-Kruskal最小生成树

5. edge 2-5: 没有环,加入
贪心算法(2)-Kruskal最小生成树

6. edge 8-6: 加入后会形成环,舍弃

7. edge 2-3: 没有环,加入
贪心算法(2)-Kruskal最小生成树

8. edge 7-8: 加入后会形成环,舍弃

9. edge 0-7: 没有环,加入
贪心算法(2)-Kruskal最小生成树

10. edge 1-2: 加入后会形成环,舍弃

11. edge 3-4: 没有环,加入
贪心算法(2)-Kruskal最小生成树

目前为止一家有了 V-1 条边,可以肯定V个顶点都一包含在内,到此结束。

代码实现:

// Kruskal 最小生成树算法
#include <stdio.h>
#include <stdlib.h>
#include <string.h> // 带有权重的边
struct Edge
{
int src, dest, weight;
}; // 无向图
struct Graph
{
// V-> 顶点个数, E->边的个数
int V, E;
// 由于是无向图,从 src 到 dest的边,同时也是 dest到src的边,按一条边计算
struct Edge* edge;
}; //构建一个V个顶点 E条边的图
struct Graph* createGraph(int V, int E)
{
struct Graph* graph = (struct Graph*) malloc( sizeof(struct Graph) );
graph->V = V;
graph->E = E;
graph->edge = (struct Edge*) malloc( graph->E * sizeof( struct Edge ) );
return graph;
} //并查集的结构体
struct subset
{
int parent;
int rank;
}; // 使用路径压缩查找元素i
int find(struct subset subsets[], int i)
{
if (subsets[i].parent != i)
subsets[i].parent = find(subsets, subsets[i].parent); return subsets[i].parent;
} // 按秩合并 x,y
void Union(struct subset subsets[], int x, int y)
{
int xroot = find(subsets, x);
int yroot = find(subsets, y);
if (subsets[xroot].rank < subsets[yroot].rank)
subsets[xroot].parent = yroot;
else if (subsets[xroot].rank > subsets[yroot].rank)
subsets[yroot].parent = xroot;
else
{
subsets[yroot].parent = xroot;
subsets[xroot].rank++;
}
} // 很据权重比较两条边
int myComp(const void* a, const void* b)
{
struct Edge* a1 = (struct Edge*)a;
struct Edge* b1 = (struct Edge*)b;
return a1->weight > b1->weight;
} // Kruskal 算法
void KruskalMST(struct Graph* graph)
{
int V = graph->V;
struct Edge result[V]; //存储结果
int e = ; //result[] 的index
int i = ; // 已排序的边的 index //第一步排序
qsort(graph->edge, graph->E, sizeof(graph->edge[]), myComp); // 为并查集分配内存
struct subset *subsets =
(struct subset*) malloc( V * sizeof(struct subset) ); // 初始化并查集
for (int v = ; v < V; ++v)
{
subsets[v].parent = v;
subsets[v].rank = ;
} // 边的数量到V-1结束
while (e < V - )
{
// Step 2: 先选最小权重的边
struct Edge next_edge = graph->edge[i++]; int x = find(subsets, next_edge.src);
int y = find(subsets, next_edge.dest); // 如果此边不会引起环
if (x != y)
{
result[e++] = next_edge;
Union(subsets, x, y);
}
// 否则丢弃,继续
} // 打印result[]
printf("Following are the edges in the constructed MST\n");
for (i = ; i < e; ++i)
printf("%d -- %d == %d\n", result[i].src, result[i].dest,
result[i].weight);
return;
} // 测试
int main()
{
/* 创建下面的图:
10
0--------1
| \ |
6| 5\ |15
| \ |
2--------3
4 */
int V = ; // 顶点个数
int E = ; //边的个数
struct Graph* graph = createGraph(V, E);
// 添加边 0-1
graph->edge[].src = ;
graph->edge[].dest = ;
graph->edge[].weight = ; graph->edge[].src = ;
graph->edge[].dest = ;
graph->edge[].weight = ; graph->edge[].src = ;
graph->edge[].dest = ;
graph->edge[].weight = ; graph->edge[].src = ;
graph->edge[].dest = ;
graph->edge[].weight = ; graph->edge[].src = ;
graph->edge[].dest = ;
graph->edge[].weight = ; KruskalMST(graph); return ;
}

运行结果如下:

Following are the edges in the constructed MST
-- ==
-- ==
-- ==

 时间复杂度:

O(ElogE) 或 O(ElogV)。 排序使用 O(ELogE) 的时间,之后我们遍历中使用并查集O(LogV) ,所以总共复杂度是 O(ELogE + ELogV)。E的值最多为V^2,所以

O(LogV) 和 O(LogE) 可以看做是一样的。

上一篇:3、U-boot的环境变量: bootcmd 和bootargs


下一篇:centos7 安装jdk7