数据结构复习之哈夫曼树及应用

哈夫曼树


最优二叉树,必考的内容,软考已经搞懂了,只是记录下。

哈夫曼树

概念

树的路径长度

从树根到树中每一结点的路径长度之和。在结点数目相同的二叉树中,完全二叉树的路径长度最短。

带权路径长度wpl

结点的权:在一些应用中,赋予树中结点的一个有某种意义的实数。

结点的带权路径长度:结点到树根之间的路径长度与该结点上权的乘积。

树的带权路径长度(WPL):定义为树中所有叶结点的带权路径长度之和。

哈夫曼树

带权路径长度WPL最小的二叉树称为最优二叉树或哈夫曼树。

哈夫曼算法

构造哈夫曼树方法

步骤:
① 将给定的权值按照从小到大排列成{W1,W2,…,Wm},并且构造出树林F={Tl,T2,…,Tm}。此时,其中的每棵树Ti (1≤i≤m)为左、右子树均为空的二叉树,二叉树的根结点的权值为Wi 。

② 把F中树根结点的权值最小的两棵二叉树T1和T2合并为一棵新的二叉树T(T的左子树为T1,右子树为T2),并令T的根结点的权值为T1和T2的根结点的权值之和,然后将T按其根结点的权值大小依次加入到树林F中。同时,从F中删去T1和T2这两棵二叉树。简言之,找两个最小的,合成一个,就删除这两个数,将合成的再加入到森林中,再找最小的两个合成一棵树…

③ 重复步骤②,直到构造成一棵哈夫曼树。

哈夫曼树的特点

① 在哈夫曼树中,权值越大的叶子离根结点越近。

② 若有n0个权值,需要进行n0-1次合并,构造成为哈夫曼树。

③ 哈夫曼树没有度为1的结点。

④ 由n0个权值构成的哈夫曼树,叶结点数为n0,度为2的结点数为 n0-1,结点总数为n0+ n2= n0+ n0-1=2n0-1。

⑤ 给定一组权值,构造出的哈夫曼树的形态可能不唯一,但它们的带权路径长度都一样。

哈夫曼编码

编码和解码

数据压缩过程称为编码。即将文件中的每个字符均转换为一个唯一的二进制位串。

数据解压过程称为解码。即将二进制位串转换为对应的字符。

前缀码方案

对字符集进行编码时,要求字符集中任一字符的编码都不是其它字符的编码的前缀,这种编码称为前缀(编)码。

哈夫曼编码

设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作为权构造一棵哈夫曼树,由哈夫曼树求得的编码就是哈夫曼编码。

真题

假设通信电文使用的字符集为{a,b,c,d,e,f,g,h},各字符在电文中出现的频度分别为:7,26,2,28,13,10,3,11,试为这8个字符设计哈夫曼编码。要求:

(1)画出你所构造的哈夫曼树(要求树中左孩子结点的权值不大于右孩子结点的权值);

(2)按左分支为0和右分支为1的规则,分别写出与每个字符对应的编码

解决:如下图:
不大于右孩子结点的权值);

(2)按左分支为0和右分支为1的规则,分别写出与每个字符对应的编码

解决:如下图:
数据结构复习之哈夫曼树及应用

上一篇:(三十三)MATLAB如何生成实高斯白噪声、复高斯白噪声


下一篇:渐进分析法