数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory limit: 65536K
题目描述
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
输入
输入数据有多组,每组数据一行,表示要编码的字符串。
输出
对应字符的
ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
示例输入
AAAAABCD THE_CAT_IN_THE_HAT
示例输出
64 13 4.9 144 51 2.8
提示
来源
xam
示例程序
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
char s[10000];
int a[1000],b[1000];
int cmp(const void* a,const void* b)
{
return (*(int *)a-*(int *)b)*-1;
}
int main()
{
int n,i,t1,t2,k;
while(scanf("%s",s)!=EOF)
{
memset(a,0,sizeof(a));
n=strlen(s);
t1=n*8;
t2=0;
for(i=0;s[i];i++)
a[s[i]]++;
k=0;
for(i=0;i<150;i++)
if(a[i])
b[k++]=a[i];
qsort(b,k,sizeof(b[0]),cmp);
i=k-1;
while(i!=-1)
{
int x1=b[i];
i--;
if(i!=-1)
{
int x2=b[i];
t2=t2+x1+x2;
b[i]=x1+x2;
qsort(b,i+1,sizeof(b[0]),cmp);
}
}
printf("%d %d %.1lf\n",t1,t2,t1*1.0/t2);
}
return 0;
}