[NOI2015]荷马史诗哈夫曼树

最新推荐文章于 2024-04-25 00:15:00 发布

原创最新推荐文章于 2024-04-25 00:15:00 发布 · 403 阅读

0 ·

CC 4.0 BY-SA版权

NOI 同时被 2 个专栏收录

11 篇文章

订阅专栏

贪心

3 篇文章

订阅专栏

本文探讨了如何使用哈夫曼树对《荷马史诗》进行编码优化，以减少其长度。问题要求找到一种编码方式，使得替换后的史诗最短，同时确保编码的非前缀性质。给出了样例和限制条件，并提到了k叉哈夫曼树在解决此类问题中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

追逐影子的人，自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后，细细地品上一杯卡布奇诺，静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了，Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词，从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词，使得其满足如下要求:

对于任意的 1≤i,j≤n，i≠j，都有：si 不是 sj 的前缀。

现在 Allison 想要知道，如何选择 si，才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下，Allison 还想知道最长的 si 的最短长度是多少？

一个字符串被称为 k 进制字符串，当且仅当它的每个字符是 0 到 k−1 之间（包括 0 和 k−1）的整数。

字符串 Str1 被称为字符串 Str2 的前缀，当且仅当：存在 1≤t≤m，使得 Str1=Str2[1..t]。其中，m 是字符串 Str2 的长度，Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式

输入文件的第 1 行包含 2 个正整数 n,k，中间用单个空格隔开，表示共有 n 种单词，需要使用 k 进制字符串进行替换。

接下来 n 行，第 i+1 行包含 1 个非负整数 wi，表示第 i 种单词的出现次数。

输出格式

输出文件包括 2 行。

第 1 行输出 1 个整数，为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数，为保证最短总长度的情况下，最长字符串 si 的最短长度。

样例一

input

output

12
2

explanation

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案：令 00(2) 替换第 1 种单词，01(2) 替换第 2 种单词，10(2) 替换第 3 种单词，11(2) 替换第 4 种单词。在这种方案下，编码以后的最短长度为：

1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。

一种非最优方案：令 000(2) 替换第 1 种单词，001(2) 替换第 2 种单词，01(2) 替换第 3 种单词，1(2) 替换第 4 种单词。在这种方案下，编码以后的最短长度为：

1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比，文章的长度相同，但是最长字符串的长度更长一些。

样例二

input

output

36
3

explanation

一种最优方案：令 000(3) 替换第 1 种单词，001(3) 替换第 2 种单词，01(3) 替换第 3 种单词，02(3) 替换第 4 种单词，1(3) 替换第 5 种单词，2(3) 替换第 6 种单词。

样例三

见样例数据下载。

限制与约定

测试点编号	n 的规模	k 的规模	备注	约定
1	n=3	k=2		0<wi≤1011
2	n=5	k=2
3	n=16	k=2	所有 wi 均相等
4	n=1000	k=2	wi 在取值范围内均匀随机
5	n=1000	k=2
6	n=100000	k=2
7	n=100000	k=2	所有 wi 均相等
8	n=100000	k=2
9	n=7	k=3
10	n=16	k=3	所有 wi 均相等
11	n=1001	k=3	所有 wi 均相等
12	n=99999	k=4	所有 wi 均相等
13	n=100000	k=4
14	n=100000	k=4
15	n=1000	k=5
16	n=100000	k=7	wi 在取值范围内均匀随机
17	n=100000	k=7
18	n=100000	k=8	wi 在取值范围内均匀随机
19	n=100000	k=9
20	n=100000	k=9

对于所有数据，保证 2≤n≤100000，2≤k≤9。

选手请注意使用 64 位整数进行输入输出、存储和计算。

时间限制：1s

空间限制：512MB

评分方式

对于每个测试点：

若输出文件的第 1 行正确，得到该测试点 40% 的分数；

若输出文件完全正确，得到该测试点 100% 的分数。

其实这道题就是一道裸的k叉哈夫曼树，哈夫曼树具体去搜吧。哈夫曼树主要应用于哈弗曼编码，为了不歧义且使编码长度最小，不歧义这一点可以通过根节点路径决定，所以是最多的越靠上就行了。对于k叉哈夫曼树的构建，我们每次选择权值最小的几个节点，并合并，然后就是一道裸题了，关键是谁知道有哈夫曼树这个东西啊

注意就是开始要加入空点

#include <bits/stdc++.h>
typedef long long ll;
#define pa pair<ll,ll>
using namespace std;
priority_queue< pa, vector<pa>, greater<pa> > q;
int n, k; pa ans, now;
int main(){
	cin>>n>>k;
	for( int i = 1; i <= n; i++ ){
		ll x; scanf( "%lld", &x );
		q.push( make_pair( x, 0 ) );
	}
	while( q.size() != 1 ){
		now.first = now.second = 0;
		for( int i = 1; i <= k; i++ ){
			pa z = q.top(); q.pop();
			now.first += z.first;
			now.second = max( now.second, z.second + 1 );
		}
		ans.first += now.first;
		ans.second = max( ans.second, now.second );
		q.push(now);
	}
	printf( "%lld\n%lld", ans.first, ans.second );
	return 0;
}