哈夫曼树及其应用_哈夫曼树的应用-优快云博客

哈夫曼树是一种最优二叉树，通过最小带权路径长度构建，适用于数据压缩。本文介绍了哈夫曼树的基本概念，包括带权路径长度、节点的带权路径长度和树的带权路径长度。详细阐述了哈夫曼树的构造步骤，并提供了C#代码实现。此外，还探讨了哈夫曼树在数据压缩中的应用，通过实例展示了如何根据字母频率构建哈夫曼树并进行编码，以减少数据传输的长度。

一、基本概念

给定N个权值作为N个叶子结点，构造一棵二叉树，若该树的带权路径长度达到最小，称这样的二叉树为最优二叉树，也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树，权值较大的结点离根较近。 ——摘自百度百科

要理解哈夫曼树，首先需要理解什么是“带权路径长度”

路径：一棵树中一个节点到达其子孙节点之间的通路称为路径。通路中的分支数目称为路径长度。从根节点到第L层节点的路径长度为L-1。例如上面这棵树中，从17->6的路径长度为3，从14->6的路径长度为2。
节点的带权路径长度：从根节点到该节点之间的路径长度与该节点的权的乘积。例如上图中从17->6的带权路径长度为 $3 \times 6 = 18$ 。
树的带权路径长度：所有叶子节点的带权路径之和。上图的树的带权路径长度为6×3+3×3+5×2+3×1=40。

二、构造哈夫曼树

构造一棵哈夫曼树需要如下步骤：
（1）将给定的n个节点看做n棵独立的树（每棵树只有一个节点）
（2）选出权值最小的两棵树作为左右子树合并为一棵树，其根节点的权值为左右子树权值的和
（3）将这两棵树从森林中删除，将新生成的数加入森林
（4）重复（2）（3）步骤直到只剩一棵树

下面通过一个具体的示例演示构造的过程。首先将给定的节点按权值排序：

选出其中权值最小的两个节点构成一棵新的树

将这两个节点从集合中删除，将新生成的树的根节点加入集合

再将G、C节点构成一棵新的树

将G、C节点删除，并将新树的根节点H加入集合

将C、H构造成一棵新的树。因为C节点权值比H小，所以C作为左孩子

删除C、H，将I加入到集合中

。。。。。。

重复上述过程，直到只剩一棵树，完成哈夫曼树的构造。

三、代码实现

首先定义出节点的结构

public class TreeNode:IComparable<TreeNode>
{
    public int Weight;
    public TreeNode? Left;
    public TreeNode? Right;

    public TreeNode(int weight)
    {
        Weight = weight;
    }
    
    public int CompareTo(TreeNode? other)
    {
        if (other == null) return 1;
        return Weight - other.Weight;
    }
}

构造哈夫曼树：

public TreeNode ConstructHuffmanTree(int[] weights)
{
	if (weights == null || weights.Length == 0) return null;
	HeapList<TreeNode> nodes = new();
	foreach (var weight in weights)
	{
		TreeNode node = new TreeNode(weight);
		nodes.Push(node);
	}

	while (nodes.Count > 1)
	{
		var left = nodes.Pop();
		var right = nodes.Pop();

		var head = new TreeNode(left.Weight + right.Weight);
		head.Left = left;
		head.Right = right;
		
		nodes.Push(head);
	}
	return nodes[0];
}

这里的HeapList是自己简单实现的一个小根堆，代码如下

public class HeapList<T> where T : IComparable<T>
{
    private T[] _items;
    // 默认数组大小
    private const int DefaultCapacity = 4;
    // 元素数量
    private int _size;
    public int Count => _size;
    // 当前数组大小
    public int Capacity
    {
        get => _items.Length;
        set
        {
            if (value < _size)
            {
                throw new ArgumentOutOfRangeException();
            }

            if (value != _items.Length)
            {
                if (value > 0)
                {
                    T[] newItems = new T[value];
                    if (_size > 0)
                    {
                        Array.Copy(_items, newItems, _size);
                    }
                    _items = newItems;
                }
                else
                {
                    _items = new T[DefaultCapacity];
                }
            }
        }
    }
    
    public HeapList()
    {
        _items = new T[DefaultCapacity];
    }

    public HeapList(int length)
    {
        _items = new T[length];
    }
    
    public T this[int index]
    {
        get
        {
            if (index < 0 || index >= _size) throw new ArgumentOutOfRangeException();
            return _items[index];
        }
    }

    /// <summary>
    /// 压入元素
    /// </summary>
    /// <param name="e"></param>
    public void Push(T e)
    {
        // 扩容
        if (_size >= _items.Length)
        {
            int newCapacity = _items.Length == 0 ? DefaultCapacity : _items.Length * 2;
            if ((uint)newCapacity > Array.MaxLength) newCapacity = Array.MaxLength;
            Capacity = newCapacity;
        }

        _items[_size] = e;
        HeapInsert(_size++);
    }

    /// <summary>
    /// 弹出元素
    /// </summary>
    public T Pop()
    {
        if (_size <= 0) throw new ArgumentOutOfRangeException();
        var node = _items[0];
        // 交换首尾元素
        (_items[_size - 1], _items[0]) = (_items[0], _items[_size - 1]);
        _size--;
        // 下沉操作
        Heapify(0);
        return node;
    }
    /// <summary>
    /// 上浮操作
    /// </summary>
    /// <param name="index"></param>
    private void HeapInsert(int index)
    {
        // 当前节点比父节点小,交换两者位置
        int parentIndex = (index - 1) / 2;
        while(_items[index].CompareTo(_items[parentIndex]) < 0 )
        {
            (_items[index], _items[parentIndex]) = (_items[parentIndex], _items[index]);
            index = parentIndex;
            parentIndex = (index - 1) / 2;
        }
    }

    /// <summary>
    /// 下沉操作
    /// </summary>
    /// <param name="index"></param>
    private void Heapify(int index)
    {
        // 左孩子节点下标
        int left = index * 2 + 1;
        while (left < _size)
        {
            int min = left;
            // 左右孩子比较
            if (left + 1 < _size && _items[left + 1].CompareTo(_items[left]) < 0)
            {
                min = left + 1;
            }
            // 与父节点比较
            if (_items[index].CompareTo(_items[min]) < 0)
            {
                break;
            }
            // 父节点与子节点交换
            (_items[index], _items[min]) = (_items[min], _items[index]);
            // 继续向下寻找
            index = min;
            left = index * 2 + 1;
        }
    }
}