Haffman树和其python代码的实现

最新推荐文章于 2024-05-08 20:00:46 发布

TFATS

最新推荐文章于 2024-05-08 20:00:46 发布

阅读量631

点赞数 2

分类专栏：算法 huffman tree 深度学习文章标签： huffman tree python

本文链接：https://blog.youkuaiyun.com/TFATS/article/details/107844216

版权

算法同时被 3 个专栏收录

43 篇文章

订阅专栏

深度学习

16 篇文章

订阅专栏

huffman tree

1 篇文章

订阅专栏

本文详细介绍哈夫曼树编码的Python实现，包括构建哈夫曼树、获取编码过程，并解释了哈夫曼编码如何根据词语频率降低存储空间。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

哈夫曼树的构建和编码

1，哈夫曼树编码的python代码实现

'''
    huffman编码
'''
import copy

class Node:
    def __init__(self, name, weight):
        self.name = name #节点名
        self.weight = weight #节点权重
        self.left = None #节点左孩子
        self.right = None #节点右孩子
        self.father = None # 节点父节点
    #判断是否是左孩子
    def is_left_child(self):
        return self.father.left == self

#创建最初的叶子节点
def create_prim_nodes(data_set, labels):
    if(len(data_set) != len(labels)):
        raise Exception('数据和标签不匹配!')
    nodes = []
    for i in range(len(labels)):
        nodes.append( Node(labels[i],data_set[i]) )
    return nodes


# 创建huffman树
def create_HF_tree(nodes):
    #此处注意，copy()属于浅拷贝，只拷贝最外层元素，内层嵌套元素则通过引用，而不是独立分配内存
    tree_nodes = nodes.copy() 
    while len(tree_nodes) > 1: #只剩根节点时，退出循环
        tree_nodes.sort(key=lambda node: node.weight)#升序排列
        new_left = tree_nodes.pop(0)
        new_right = tree_nodes.pop(0)
        new_node = Node(None, (new_left.weight + new_right.weight))
        new_node.left = new_left
        new_node.right = new_right
        new_left.father = new_right.father = new_node
        tree_nodes.append(new_node)
    tree_nodes[0].father = None #根节点父亲为None
    return tree_nodes[0] #返回根节点

#获取huffman编码
def get_huffman_code(nodes):
    codes = {}
    for node in nodes:
        code=''
        name = node.name
        while node.father != None:
            if node.is_left_child():
                code = '0' + code
            else:
                code = '1' + code
            node = node.father
        codes[name] = code
    return codes


if __name__ == '__main__':
    labels = ['我','喜欢','观看','巴西','足球','世界杯']
    data_set = [15,8,6,5,3,1]
    nodes = create_prim_nodes(data_set,labels)#创建初始叶子节点
    root = create_HF_tree(nodes)#创建huffman树
    codes = get_huffman_code(nodes)#获取huffman编码
    #打印huffman码
    for key in codes.keys():
        print(key,': ',codes[key])