题目1(经典哈夫曼树的模型):
题目描述
在一个果园里,多多已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。
每一次合并,多多可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。可以看出,所有的果子经过n-1次合并之后,就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所耗体力之和。
因为还要花大力气把这些果子搬回家,所以多多在合并果子时要尽可能地节省体力。假定每个果子重量都为1,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使多多耗费的体力最少,并输出这个最小的体力耗费值。
例如有3种果子,数目依次为1,2,9。可以先将1、2堆合并,新堆数目为3,耗费体力为3。接着,将新堆与原先的第三堆合并,又得到新的堆,数目为12,耗费体力为12。所以多多总共耗费体力=3+12=15。可以证明15为最小的体力耗费值。
输入描述:
输入包括两行,第一行是一个整数n(1<=n<=10000),表示果子的种类数。第二行包含n个整数,用空格分隔,第i个整数ai(1<=ai<=20000)是第i种果子的数目。
输出描述:
输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。输入数据保证这个值小于2^31。
备注:
对于30%的数据,保证有n<=1000: 对于50%的数据,保证有n<=5000; 对于全部的数据,保证有n<=10000。
示例1
输入
3 1 2 9
输出
15
算法
(贪心,哈夫曼树,堆,优先队列) O(nlogn)
经典哈夫曼树的模型,每次合并重量最小的两堆果子即可。
时间复杂度
使用小根堆维护所有果子,每次弹出堆顶的两堆果子,并将其合并,合并之后将两堆重量之和再次插入小根堆中。
每次操作会将果子的堆数减一,一共操作 n−1
次即可将所有果子合并成1堆。每次操作涉及到2次堆的删除操作和1次堆的插入操作,计算量是 O(logn)。因此总时间复杂度是 O(nlogn)。
AC代码
#include<bits/stdc++.h>
using namespace std;
int main()
{
int n,x;
int a,b;
cin >> n;
priority_queue<int, vector<int>, greater<int> > heap;
while (n -- )
{
cin >> x;
heap.push(x);
}
int ans = 0;
while (heap.size() > 1)
{
a = heap.top(); heap.pop();
b = heap.top(); heap.pop();
ans += a + b;
heap.push(a + b);
}
cout << ans;
return 0;
}
题目2(哈夫曼树应用,K叉哈夫曼树+哈夫曼编码 )
题目描述:
追逐影子的人,自己就是影子。 ——荷马
达达最近迷上了文学。
她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。
但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。
达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。
在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。
其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
输入格式
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
第2~n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si的最短长度。
数据范围
2≤n≤100000
2≤k≤9
样例
输入样例:
4 2
1
1
2
2
输出样例:
12
2
K叉哈夫曼树+哈夫曼编码
这道题目,如果说你做过哈夫曼树,相信你一样就会捕捉到上面加粗的黑体字,也就是关键字.我们发现这道题目,要求我们算出哈夫曼编码,也就是最短不重叠前缀的编码,那么我们就可以用上trie字典树的性质配合哈夫曼树进行处理.
哈夫曼树,就是满足权值*路径长度最短的树,因此我们这道题目直接可以开哈夫曼树处理即可,代码很清晰.
AC代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N = 1e5 + 10;
#define pll pair<ll,ll>
#define mk(a,b) make_pair(a,b)
priority_queue< pll, vector<pll>, greater<pll> > p; // 懒人必备pair,第一关键字,第二关键字
int main()
{
ll i,j;
ll n,k,m,x;
ll res;
cin >> n >> k;
for(i = 1; i <= n ; i ++)
{
cin >> x;
p.push(mk(x,0)); // 压入节点
}
while((p.size() - 1) % (k - 1) != 0) p.push(pll(0,0)); // 补充0节点,满足k叉哈夫曼树
while(p.size() >= k)
{
ll deep = -1,temp = 0;
for(j = 1 ; j <= k ; j ++)
{
pll dx = p.top();
p.pop();
temp += dx.first;
deep = max(deep,dx.second); // 深度要最低,但是我们的深度是反过来,所以不要用min要用max
}
p.push(mk(temp,deep + 1));
res += temp; // 计算总权值
}
cout << res << endl;
cout << p.top().second << endl;
return 0;
}
1315

被折叠的 条评论
为什么被折叠?



