数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KB
Submit Statistic
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Example Input
AAAAABCD
THE_CAT_IN_THE_HAT
Example Output
64 13 4.9
144 51 2.8
Hint
Author
xam
哈夫曼树:最优二叉树(带权路径长度最短的二叉树)。
通常规定,左子树根节点的权值<=右子树根节点的权值。
#include<bits/stdc++.h>
using namespace std;
int main()
{
string a;
while(cin>>a)
{
int v[1210];
priority_queue<int, vector<int>, greater<int> > q;//优先队列
/*最先出队的为最大值或者最小值,可根据情况自己更改*/
memset(v,0,sizeof(v));
int la = 8 *a.size();//8位二进制
for(int i=0;i<a.length();i++)
{
v[a[i]]++;//计算个数

本文介绍了哈夫曼编码,一种基于字符出现概率构造最优编码的可变字长编码方式,常用于数据文件压缩。内容包括哈夫曼树的概念、如何计算编码长度的比值,以及与ASCII编码的比较。此外,还提到了与合并果子问题类似的数据结构应用,涉及到最小体力耗费的计算。最后,讨论了一个关于木材切割和成本优化的问题,农民约翰如何以最低费用将长木板切割成所需长度的木板。
最低0.47元/天 解锁文章
1256

被折叠的 条评论
为什么被折叠?



