小蚂蚁学习数据结构(22)——哈夫曼编码的认识

本文详细介绍了赫夫曼树及其构造方法,并解释了如何使用赫夫曼编码实现高效的数据压缩。通过选取字符出现频率作为权重,创建的赫夫曼树能够确保编码后的数据具有最短的路径长度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

赫夫曼树(Huffman)——带权路径长度最短的树(又称最优树)

定义:

    路径:

        从树中一个结点到另一个结点之间的分支构成这两个结点间的路径

    路径长度:

        路径上的分支数

    树的路径长度:

        从树根到每一个结点的路径长度之和

    结点的带权路径长度:

        从该结点到树根之间的路径长度与结点上权的乘积

    树的带权路径长度:

        树中所有带权节点的路径长度之和

赫夫曼树的定义:

    有n个叶子结点,每个结点带有权值,构成一个带权路径最小的二叉树,就称为赫夫曼树。(自己定义的)

构造赫夫曼树的方法:

    构造赫夫曼树的步骤:

        1,给定的n个权值{w1,w2,w3……wn},构造n棵只有根结点的二叉树,令其权值为wj。

        2,在森林中选取两个根结点权值最小的树作为左右子树,构造一个新的二叉树,将新的二叉树根节点权值为其左右子树根结点权值之和

        3,在森林中删除这两个树,同时将新得到的二叉树加入森林中

        4,重复上述两步,直到只含有一棵树为止,这棵树就是赫夫曼树

赫夫曼编码:数据通信用的二进制编码

    思想:

        根据字符出现频率编码,是电文总长最短

    编码方法:

        根据上面创造赫夫曼树的步骤创建赫夫曼树,然后左分支为0,又分支为1。每个字符的编码就是从根到每个叶子的路径上得到的0、1序列。

    译码方法:

        从赫夫曼树树根开始,从待译码电文中逐位取码。若编码是0,则向左走;若编码是1,则像右走,一旦到达了叶子节点,则翻译出一个字符;再从根出发,直到电文结束。

        

学PHP的小蚂蚁 博客 http://my.oschina.net/woshixiaomayi/blog



转载于:https://my.oschina.net/woshixiaomayi/blog/608181

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值