赫夫曼树的定义及构造，赫夫曼编码的定义及构造，算法实现和存储

最新推荐文章于 2021-03-25 19:30:52 发布

爱吃银鱼蒸蛋的麻里

最新推荐文章于 2021-03-25 19:30:52 发布

阅读量1.5k

点赞数 2

分类专栏：数据结构

本文链接：https://blog.youkuaiyun.com/so_cute_sjm/article/details/104151407

版权

数据结构专栏收录该内容

19 篇文章

订阅专栏

文章目录

一. 赫夫曼树（最优二叉树）
二. 构造赫夫曼树
三. 赫夫曼编码
四. 构造赫夫曼编码
五. 赫夫曼树和赫夫曼编码的存储表示
六. 求赫夫曼树和赫夫曼编码的算法

一. 赫夫曼树（最优二叉树）

设二叉树具有n个带权值的叶子结点，从根结点到每一个叶子结点都有一个路径长度。
从根结点到各个叶子结点的路径长度与相应结点权值的乘积的和称为该二叉树的带权路径长度，记作

其中，Wi为第i个叶子结点的权值，Li为第i个叶子结点的路径长度。
如：
给定一组具有确定权值的叶子结点，可以构造出许多的二叉树。
例如，用4个整数2，3，4，11作为4个叶子结点的权值，总共可以构造出120棵不同的二叉树，他们的带权路径长度可能不相同，把其中具有最小带权路径长度的二叉树称为赫夫曼树。

二. 构造赫夫曼树

根据赫夫曼树的定义，一棵二叉树要使其WPL值最小，必须使权值较大的叶子结点越靠近根结点。
而权值最小的叶子结点越远离根结点。
构造过程：
①. 由给定的n个权值{W1，W2,…,Wn}构造n棵只有一个根结点的二叉树，从而得到一个二叉树的集合F={T1,T2,…,Tn}。
②. 在F中选取根结点的权值最小和次小的两棵二叉树Ti，Tj 进行合并，即增加一个根结点，将Ti，Tj 分别作为它的左右子树，该根结点的权值为其左右子树根结点权值之和。
③. 重复步骤②，当F中只剩下一棵二叉树时，这颗二叉树便是所要建立的赫夫曼树。

三. 赫夫曼编码

赫夫曼编码具有广泛的应用，利用赫夫曼树构造的用于通信的二进制编码称为赫夫曼编码。
若要设计长短不等的编码，则必须是任一个字符的编码都不是另一个字符的编码的前缀，这种编码称为前缀编码。

四. 构造赫夫曼编码

用给定的若干字符的频度为权值生成赫夫曼树，并在每个叶子上注明对应的字符。
树中从根到每个叶子都有一条路径，对路径上的各分支约定指向左子树根的分支表示“0”码，指向右子树的分支表示“1”码，取每条路径上的“0”或“1”的序列作为和各个叶子对应的字符的编码，这就是赫夫曼编码。

五. 赫夫曼树和赫夫曼编码的存储表示

typedef struct{
	unsigned int weight;
	unsigned int parent,lchild,rchild;
}HTNode char *HuffmanTree;      //动态分配数组存储赫夫曼树
typedef char * *HuffmanCode;    //动态分配数组存储赫夫曼树编码表

六. 求赫夫曼树和赫夫曼编码的算法

void HuffmanCoding(HuffmanTree &HT, HuffmanCode &HC, int *w, int n)
{//w存放n个字符的权值(均>0)，构造赫夫曼树HT，并求出n个字符的赫夫曼编码HC 
	if(n<=1)
		return ;
	m=2*n-1;
	HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));  //0号单元未用
	for(p=HT, i=1; i<=n; ++i, ++p, ++w)
		*p={*w,0,0,0};
	for( ; i<=m; ++i, ++p)
		*p={0,0,0,0};
	for(i=n+1; i<=m; ++i)       //建赫夫曼树 
	{//在HT[l..i-1]选择parent为0，且weight最小的两个结点，其序号分别为上s1和s2 
		Select(HT,i-1,s1,s2);
		HT[s1].parent = i;
		HT[s2].parent = i;
		HT[i].lchild = s1;
		HT[i].rchild = s2;
		HT[i].weight = HT[s1].weight + HT[s2].weight;
	}
	
	
	
	//从叶子到根逆向求每个字符的赫夫曼编码
	Hc=(HuffmanTree)malloc((n+1)*sizeof(char * ));  //分配n个字符编码的头指针向量
	cd=(char * )malloc(n * sizeof(char));           //分配求编码的工作空间
	cd[n-1]="\0";        //编码结束符 
	for(i=1; i<=n; ++i)  //逐个字符求赫夫曼编码 
	{
		start=n-1;
		for(c=i, f=HT[i].parent; f!=0; c=f, f=HT[f].parent)//从叶子到根逆向求编码 
		{
			if(HT[f].lchild == c)
				cd[ - - start]="0";
			else
				cd[ - - start]="1";
		}
		HC[i]=(char * )malloc((n-start) * sizeof(char));//为第i个字符编码分批空间
		strcpy(HC[i],&cd[start]);  //从cd复制编码(串)到HC 
	}
	free(cd);       //释放工作空间 
} //HuffmanCoding