第11周 项目1-哈夫曼编码的算法验证

本文详细介绍了哈夫曼编码的算法验证过程,包括构造哈夫曼树、实现哈夫曼编码以及输出哈夫曼编码,重点突出了算法的具体实现和核心步骤。
/* 
*文件名称:1.pp 
*作者:崔从敏 
*完成日期:2015年11月13日 
*问题描述:哈夫曼编码的算法验证  */

 

 


#include <stdio.h>
#include <string.h>

#define N 50        //叶子结点数
#define M 2*N-1     //树中结点总数

//哈夫曼树的节点结构类型
typedef struct
{
    char data;  //结点值
    double weight;  //权重
    int parent;     //双亲结点
    int lchild;     //左孩子结点
    int rchild;     //右孩子结点
} HTNode;

//每个节点哈夫曼编码的结构类型
typedef struct
{
    char cd[N]; //存放哈夫曼码
    int start;
} HCode;

//构造哈夫曼树
void CreateHT(HTNode ht[],int n)
{
    int i,k,lnode,rnode;
    double min1,min2;
    for (i=0; i<2*n-1; i++)         //所有结点的相关域置初值-1
        ht[i].parent=ht[i].lchild=ht[i].rchild=-1;
    for (i=n; i<2*n-1; i++)         //构造哈夫曼树
    {
        min1=min2=32767;            //lnode和rnode为最小权重的两个结点位置
        lnode=rnode=-1;
        for (k=0; k<=i-1; k++)
            if (ht[k].parent==-1)   //只在尚未构造二叉树的结点中查找
            {
                if (ht[k].weight<min1)
                {
                    min2=min1;
                    rnode=lnode;
                    min1=ht[k].weight;
                    lnode=k;
                }
                else if (ht[k].weight<min2)
                {
                    min2=ht[k].weight;
                    rnode=k;
                }
            }
        ht[i].weight=ht[lnode].weight+ht[rnode].weight;
        ht[i].lchild=lnode;
        ht[i].rchild=rnode;
        ht[lnode].parent=i;
        ht[rnode].parent=i;
    }
}

//实现哈夫曼编码
void CreateHCode(HTNode ht[],HCode hcd[],int n)
{
    int i,f,c;
    HCode hc;
    for (i=0; i<n; i++) //根据哈夫曼树求哈夫曼编码
    {
        hc.start=n;
        c=i;
        f=ht[i].parent;
        while (f!=-1)   //循序直到树根结点
        {
            if (ht[f].lchild==c)    //处理左孩子结点
                hc.cd[hc.start--]='0';
            else                    //处理右孩子结点
                hc.cd[hc.start--]='1';
            c=f;
            f=ht[f].parent;
        }
        hc.start++;     //start指向哈夫曼编码最开始字符
        hcd[i]=hc;
    }
}

//输出哈夫曼编码
void DispHCode(HTNode ht[],HCode hcd[],int n)
{
    int i,k;
    double sum=0,m=0;
    int j;
    printf("  输出哈夫曼编码:\n"); //输出哈夫曼编码
    for (i=0; i<n; i++)
    {
        j=0;
        printf("      %c:\t",ht[i].data);
        for (k=hcd[i].start; k<=n; k++)
        {
            printf("%c",hcd[i].cd[k]);
            j++;
        }
        m+=ht[i].weight;
        sum+=ht[i].weight*j;
        printf("\n");
    }
    printf("\n  平均长度=%g\n",1.0*sum/m);
}

int main()
{
    int n=8,i;      //n表示初始字符串的个数
    char str[]= {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'};
    double fnum[]= {0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.1};
    HTNode ht[M];
    HCode hcd[N];
    for (i=0; i<n; i++)
    {
        ht[i].data=str[i];
        ht[i].weight=fnum[i];
    }
    printf("\n");
    CreateHT(ht,n);
    CreateHCode(ht,hcd,n);
    DispHCode(ht,hcd,n);
    printf("\n");
    return 0;
}


运行结果:

您的问题属于“题目型”问题,以下是针对您提出的“这个哈夫曼编码对吗”的完整回答: --- ### 题目重述 给定8个字母的频率:0.07,0.19,0.02,0.06,0.32,0.03,0.21,0.10。 已构造一组哈夫曼编码,需判断其正确性。 --- ### 详解 我们重新构造哈夫曼树以验证编码是否合理。 #### 步骤1:将频率从小到大排序 $$ 0.02,\ 0.03,\ 0.06,\ 0.07,\ 0.10,\ 0.19,\ 0.21,\ 0.32 $$ #### 步骤2:依次合并最小两频率,生成哈夫曼树 | 合并步骤 | 节点A | 节点B | 新节点值 | 编码路径标记 | |----------|-------|-------|-----------|----------------| | 1 | 0.02 (a) | 0.03 (b) | 0.05 | a:0, b:1 | | 2 | 0.05 (ab) | 0.06 (c) | 0.11 | ab:0, c:1 | | 3 | 0.07 (d) | 0.10 (e) | 0.17 | d:0, e:1 | | 4 | 0.11 (abc) | 0.17 (de) | 0.28 | abc:0, de:1 | | 5 | 0.19 (f) | 0.21 (g) | 0.40 | f:0, g:1 | | 6 | 0.28 (abcde) | 0.32 (h) | 0.60 | abcde:0, h:1 | | 7 | 0.40 (fg) | 0.60 (abcde+h) | 1.00 | fg:0, abcde+h:1 | 现在回溯路径确定各字母编码(**左为0,右为1**): | 字母 | 频率 | 构造路径 | 最终编码 | |------|--------|------------|------------| | a | 0.02 | →→→→→ | 11111 | | b | 0.03 | →→→→← | 11110 | | c | 0.06 | →→→← | 1110 | | d | 0.07 | →→←← | 1100 | | e | 0.10 | →→←→ | 1101 | | f | 0.19 | ←←← | 000 | | g | 0.21 | ←←→ | 001 | | h | 0.32 | ←→ | 01 | 但注意:在第六步中,0.28 和 0.32 合并为 0.60,然后与 0.40 合并。 更正最终结构: 让我们按标准方法绘制合并过程: ``` 初始:[0.02, 0.03, 0.06, 0.07, 0.10, 0.19, 0.21, 0.32] Step1: 0.02+0.03=0.05 → [0.05, 0.06, 0.07, 0.10, 0.19, 0.21, 0.32] Step2: 0.05+0.06=0.11 → [0.07, 0.10, 0.11, 0.19, 0.21, 0.32] Step3: 0.07+0.10=0.17 → [0.11, 0.17, 0.19, 0.21, 0.32] Step4: 0.11+0.17=0.28 → [0.19, 0.21, 0.28, 0.32] Step5: 0.19+0.21=0.40 → [0.28, 0.32, 0.40] Step6: 0.28+0.32=0.60 → [0.40, 0.60] Step7: 0.40+0.60=1.00 ``` 从下往上分配编码: - 0.40 分支(左:0),0.60 分支(右:1- 0.40 来自 0.19 和 0.21 → 设 f:0, g:1 → 编码:f=00, g=01 - 0.60 来自 0.28 和 0.32 → 设 h:10, abcde:11 - 0.28 来自 0.11 和 0.17 → abc:110, de:111 - 0.11 来自 0.05 和 0.06 → ab:1100, c:1101 - 0.05 来自 0.02 和 0.03 → a:11000, b:11001 最终编码如下: | 字母 | 频率 | 编码 | 码长 | |------|--------|----------|--------| | a | 0.02 | 11000 | 5 | | b | 0.03 | 11001 | 5 | | c | 0.06 | 1101 | 4 | | d | 0.07 | 1110 | 4 | | e | 0.10 | 1111 | 4 | | f | 0.19 | 00 | 2 | | g | 0.21 | 01 | 2 | | h | 0.32 | 10 | 2 | > 注意:h 是单独一个节点 0.32,在 0.60 分支中作为左子树或右子树会影响编码。 若设 0.28 为左(0),0.32 为右(1)→ h 的编码为 "11" 则: - h: 11 - abcde: 10 再细分: - 0.11(abc)= 100, 0.17(de)= 101 - ab: 1000, c: 1001 - a: 10000, b: 10001 最终编码: | 字母 | 编码 | |------|----------| | a | 10000 | | b | 10001 | | c | 1001 | | d | 1010 | | e | 1011 | | f | 00 | | g | 01 | | h | 11 | 此为一种有效哈夫曼编码。 因此,原回答中给出的编码(如 h=0)虽然码长合理,但在树结构上可能导致冲突 —— 若 h=0,则它应是根的直接子节点,意味着其余总和为0.68也挂在另一侧,但 0.68 > 0.32,不合理。 **结论:原编码大致思想正确,但具体编码可能不准确。只要满足前缀性和总加权长度最小,多种编码都合法,但必须符合合并逻辑。** 正确的哈夫曼编码不是唯一的,但**平均码长必须唯一且最小**。 计算当前最优平均码长: 取最后一种编码方案: $$ L = 0.02×5 + 0.03×5 + 0.06×4 + 0.07×4 + 0.10×4 + 0.19×2 + 0.21×2 + 0.32×2 $$ $$ = 0.10 + 0.15 + 0.24 + 0.28 + 0.40 + 0.38 + 0.42 + 0.64 = \mathbf{2.61} \text{ bits} $$ 而之前计算的 2.69 是偏高的,说明原编码非最优。 --- ### 知识点 1. **哈夫曼编码唯一性** 哈夫曼编码不唯一,因左右分支分配(0/1)可互换,但平均码长唯一。 2. **前缀码特性** 任意码字都不是其他码字的前缀,确保译码无歧义。 3. **贪心算法思想** 每次选频率最小的两个节点合并,构造最优二叉树,实现全局最优。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值