哈夫曼树 = =

原创已于 2022-01-21 10:44:04 修改 · 179 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

于 2022-01-18 12:08:44 首次发布

好题专栏收录该内容

20 篇文章

订阅专栏

题目1（经典哈夫曼树的模型）：

题目描述

在一个果园里，多多已经将所有的果子打了下来，而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。

每一次合并，多多可以把两堆果子合并到一起，消耗的体力等于两堆果子的重量之和。可以看出，所有的果子经过n-1次合并之后，就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所耗体力之和。

因为还要花大力气把这些果子搬回家，所以多多在合并果子时要尽可能地节省体力。假定每个果子重量都为1，并且已知果子的种类数和每种果子的数目，你的任务是设计出合并的次序方案，使多多耗费的体力最少，并输出这个最小的体力耗费值。

例如有3种果子，数目依次为1，2，9。可以先将1、2堆合并，新堆数目为3，耗费体力为3。接着，将新堆与原先的第三堆合并，又得到新的堆，数目为12，耗费体力为12。所以多多总共耗费体力=3+12=15。可以证明15为最小的体力耗费值。

输入描述:

输入包括两行，第一行是一个整数n(1<＝n<=10000)，表示果子的种类数。第二行包含n个整数，用空格分隔，第i个整数ai(1<＝ai<=20000)是第i种果子的数目。

输出描述:

输出包括一行，这一行只包含一个整数，也就是最小的体力耗费值。输入数据保证这个值小于2^31。

备注:

对于30％的数据，保证有n<=1000：
对于50％的数据，保证有n<=5000；
对于全部的数据，保证有n<=10000。

示例1

输入

3
1 2 9

输出

算法
(贪心,哈夫曼树,堆,优先队列) O(nlogn)

经典哈夫曼树的模型，每次合并重量最小的两堆果子即可。

时间复杂度

使用小根堆维护所有果子，每次弹出堆顶的两堆果子，并将其合并，合并之后将两堆重量之和再次插入小根堆中。

每次操作会将果子的堆数减一，一共操作 n−1
次即可将所有果子合并成1堆。每次操作涉及到2次堆的删除操作和1次堆的插入操作，计算量是 O(logn)。因此总时间复杂度是 O(nlogn)。

AC代码

#include<bits/stdc++.h>

using namespace std;

int main()
{
    int n,x;
    int a,b;
    cin >> n;
    priority_queue<int, vector<int>, greater<int> > heap;
    while (n -- )
    {
        cin >> x;
        heap.push(x);
    }
    int ans = 0;
    while (heap.size() > 1)
    {
        a = heap.top(); heap.pop();
        b = heap.top(); heap.pop();
        ans += a + b;
        heap.push(a + b);
    }
    cout << ans;
    return 0;
}

题目2（哈夫曼树应用，K叉哈夫曼树+哈夫曼编码）

题目描述：

追逐影子的人，自己就是影子。 ——荷马

达达最近迷上了文学。

她喜欢在一个慵懒的午后，细细地品上一杯卡布奇诺，静静地阅读她爱不释手的《荷马史诗》。

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。

达达想要用 k 进制串 si 来替换第 i 种单词，使得其满足如下要求:

对于任意的 1≤i,j≤n，i≠j，都有：si 不是 sj 的前缀。

现在达达想要知道，如何选择 si，才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下，达达还想知道最长的 si 的最短长度是多少？

一个字符串被称为 k 进制字符串，当且仅当它的每个字符是 0 到 k−1 之间（包括 0 和 k−1）的整数。

字符串 Str1 被称为字符串 Str2 的前缀，当且仅当：存在 1≤t≤m，使得 Str1=Str2[1..t]。

其中，m 是字符串 Str2 的长度，Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式
输入文件的第 1 行包含 2 个正整数 n,k，中间用单个空格隔开，表示共有 n 种单词，需要使用 k 进制字符串进行替换。

第2~n+1 行：第 i+1 行包含 1 个非负整数 wi，表示第 i 种单词的出现次数。

输出格式
输出文件包括 2 行。

第 1 行输出 1 个整数，为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数，为保证最短总长度的情况下，最长字符串 si的最短长度。

数据范围
2≤n≤100000

2≤k≤9

样例

输入样例：
4 2
1
1
2
2
输出样例：
12
2

K叉哈夫曼树+哈夫曼编码
这道题目,如果说你做过哈夫曼树,相信你一样就会捕捉到上面加粗的黑体字,也就是关键字.我们发现这道题目,要求我们算出哈夫曼编码,也就是最短不重叠前缀的编码,那么我们就可以用上trie字典树的性质配合哈夫曼树进行处理.
哈夫曼树,就是满足权值*路径长度最短的树,因此我们这道题目直接可以开哈夫曼树处理即可,代码很清晰.

AC代码：

#include<bits/stdc++.h>

using namespace std;

typedef long long ll;

const int N = 1e5 + 10;

#define pll pair<ll,ll>
#define mk(a,b) make_pair(a,b)
priority_queue< pll, vector<pll>, greater<pll> > p; // 懒人必备pair，第一关键字，第二关键字 

     
int main()
{
    ll i,j;
	ll n,k,m,x;
	ll res;
	cin >> n >> k;
	for(i = 1; i <= n ; i ++)
	{
		cin >> x;
		p.push(mk(x,0)); // 压入节点 
	} 
	while((p.size() - 1) % (k - 1) != 0)  p.push(pll(0,0)); // 补充0节点，满足k叉哈夫曼树 
    while(p.size() >= k)
	{
		ll deep = -1,temp = 0;
		for(j = 1 ; j <= k ; j ++)
		{
			pll dx = p.top();
			p.pop();
			temp += dx.first;
			deep = max(deep,dx.second); // 深度要最低，但是我们的深度是反过来，所以不要用min要用max 
		}
		p.push(mk(temp,deep + 1));
		res += temp; // 计算总权值 
	} 
	cout << res << endl;
	cout << p.top().second << endl;
	return 0;
}