【算法总结】哈夫曼树

在一棵树中,从任意一个结点到达另一个结点的通路被称为路径,该路径上所需经过的边的个数被称为该路径的长度。若树中结点带有表示某种意义的权值,那么从根结点到达该节点的路径长度再乘以该结点权值被称为该结点的带权路径长度。树所有的叶子结点的带权路径长度和为该树的带权路径长度和。给定 n 个结点和它们的权值,以它们为叶子结点构造一棵带权路径和最小的二叉树, 该二叉树即为哈夫曼树,同时也被称为最优树。

给定结点的哈夫曼树可能不唯一,所以关于哈夫曼树的机试题往往需要求解的是其最小带权路径长度和。回顾一下我们所熟知的哈夫曼树求法。

1.将所有结点放入集合 K。

2.若集合 K 中剩余结点大于 2 个,则取出其中权值最小的两个结点,构造他们同时为某个新节点的左右儿子,该新节点是他们共同的双亲结点,设定它的权值为其两个儿子结点的权值和。并将该父亲结点放入集合 K。重复步骤 2 或 3。

3.若集合 K 中仅剩余一个结点,该结点即为构造出的哈夫曼树数的根结点, 所有构造得到的中间结点(即哈夫曼树上非叶子结点)的权值和即为该哈夫曼树的带权路径和。

为了方便快捷高效率的求得集合 K 中权值最小的两个元素,我们需要使用堆数据结构。它可以以 O(logn)的复杂度取得 n 个元素中的最小元素。为了绕过对堆的实现我们使用标准模板库中的相应的标准模板——优先队列。

:有4 个结点 a, b, c, d,权值分别为 7, 5, 2, 4,试构造以此 4 个结点为叶子结点的二叉树。

根据给定的n个权值{w1,w2,…,wn}构成二叉树集合F={T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为wi的根结点,其左右子树为空.

【算法总结】哈夫曼树

在F中选取两棵根结点权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左右子树根结点的权值之和.

在F中删除这两棵树,同时将新的二叉树加入F中.

【算法总结】哈夫曼树

重复,直到F只含有一棵树为止.(得到哈夫曼树)

【算法总结】哈夫曼树

【算法总结】哈夫曼树

利用语句 

priority_queue<int> Q; 

建立一个保存元素为 int 的堆 Q,但是请特别注意这样建立的堆其默认为大顶堆,即我们从堆顶取得的元素为整个堆中最大的元素。而在求哈夫曼树中,我们恰恰需要取得堆中最小的元素,于是我们使用如下语句定义一个小顶堆: (关于这一点见补充)

priority_queue<int , vector<int> , greater<int> > Q; 

例 3.3 哈夫曼树

AC代码

#include<cstdio>
#include<queue>

using namespace std;

priority_queue<int, vector<int>, greater<int> >Q;//建立一个小顶堆

int main()
{
    int n;
    while (scanf("%d", &n) != EOF)
    {
        while (Q.empty() == false)Q.pop();//清空堆中元素
        for (int i = 1; i <= n; i++)//输入n个叶子结点权值
        {
            int x;
            scanf("%d", &x);
            Q.push(x);//第一步,将n个叶子结点全放入堆中
        }
        int ans = 0;//保存答案
        while (Q.size() > 1)//当堆中元素大于1个
        {
            int a = Q.top();
            Q.pop();
            int b = Q.top();
            Q.pop();//第二步,取出堆中两个最小的元素,设置为同一节点的左右耳子,且双亲节点的权值为他们的和
            ans += a + b;//父节点必为非叶子结点
            Q.push(a + b);//将双亲结点放回堆中
        }
        printf("%d\n", ans);//输出答案
    }
    return 0;
}

补充:关于priority_queue

priority_queue 对于基本类型的使用方法相对简单。他的模板声明带有三个参数,priority_queue<Type, Container, Functional>
Type 为数据类型, Container 为保存数据的容器,Functional 为元素比较方式。
Container 必须是用数组实现的容器,比如 vector, deque 但不能用 list.
STL里面容器默认用的是 vector. 比较方式默认用 operator< , 所以如果你把后面俩个参数缺省的话,优先队列就是大顶堆,队头元素最大。
看例子

#include <iostream>
#include <queue>
using namespace std;
int main(){
    priority_queue<int,vector<int>,less<int> >q;//使用priority_queue<int> q1;一样
    for(int i=0;i<10;i++) 
        q1.push(i);
    while(!q1.empty()){
        cout<<q1.top()<< endl;
        q1.pop();
    }
    return 0;
}

如果要用到小顶堆,则一般要把模板的三个参数都带进去。
STL里面定义了一个仿函数 greater<>,对于基本类型可以用这个仿函数声明小顶堆
例子:

#include <iostream>
#include <queue>
using namespace std;
int main(){
    priority_queue<int,vector<int>,greater<int> >q;
    for(int i=0;i<10;i++) 
        q.push(i);
    while(!q.empty()){
        cout<<q.top()<< endl;
        q.pop();
    }
    return 0;
}

 

上一篇:[FreeRTOS].FreeRTOS CortexM3 M4中断优先级设置总结


下一篇:优先队列学习