[NOI2015]荷马史诗 哈夫曼树

本文探讨了如何使用哈夫曼树对《荷马史诗》进行编码优化,以减少其长度。问题要求找到一种编码方式,使得替换后的史诗最短,同时确保编码的非前缀性质。给出了样例和限制条件,并提到了k叉哈夫曼树在解决此类问题中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 nn 种不同的单词,从 11 到 nn 进行编号。其中第 ii 种单词出现的总次数为 wiwi。Allison 想要用 kk 进制串 sisi 来替换第 ii 种单词,使得其满足如下要求:

对于任意的 1i,jn1≤i,j≤niji≠j,都有:sisi 不是 sjsj 的前缀。

现在 Allison 想要知道,如何选择 sisi,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 sisi 的最短长度是多少?

一个字符串被称为 kk 进制字符串,当且仅当它的每个字符是 00 到 k1k−1 之间(包括 00 和 k1k−1)的整数。

字符串 Str1Str1 被称为字符串 Str2Str2 的前缀,当且仅当:存在 1tm1≤t≤m,使得 Str1=Str2[1..t]Str1=Str2[1..t]。其中,mm 是字符串 Str2Str2 的长度,Str2[1..t]Str2[1..t] 表示 Str2Str2 的前 tt 个字符组成的字符串。

输入格式

输入文件的第 11 行包含 22 个正整数 n,kn,k,中间用单个空格隔开,表示共有 nn 种单词,需要使用 kk 进制字符串进行替换。

接下来 nn 行,第 i+1i+1 行包含 11 个非负整数 wiwi,表示第 ii 种单词的出现次数。

输出格式

输出文件包括 2 行。

第 11 行输出 11 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 22 行输出 11 个整数,为保证最短总长度的情况下,最长字符串 sisi 的最短长度。

样例一

input
4 2
1
1
2
2

output
12
2

explanation

用 X(k)X(k) 表示 XX 是以 kk 进制表示的字符串。

一种最优方案:令 00(2)00(2) 替换第 11 种单词,01(2)01(2) 替换第 22 种单词,10(2)10(2) 替换第 33 种单词,11(2)11(2) 替换第 44 种单词。在这种方案下,编码以后的最短长度为:

1×2+1×2+2×2+2×2=121×2+1×2+2×2+2×2=12

最长字符串 sisi 的长度为 22

一种非最优方案:令 000(2)000(2) 替换第 11 种单词,001(2)001(2) 替换第 22 种单词,01(2)01(2) 替换第 3 种单词,1(2)1(2) 替换第 44 种单词。在这种方案下,编码以后的最短长度为:

1×3+1×3+2×2+2×1=121×3+1×3+2×2+2×1=12

最长字符串 sisi 的长度为 33。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。

样例二

input
6 3
1
1
3
3
9
9

output
36
3

explanation

一种最优方案:令 000(3)000(3) 替换第 11 种单词,001(3)001(3) 替换第 22 种单词,01(3)01(3) 替换第 33 种单词,02(3)02(3) 替换第 44 种单词,1(3)1(3) 替换第 55 种单词,2(3)2(3) 替换第 66 种单词。

样例三

见样例数据下载。

限制与约定

测试点编号 nn 的规模 kk 的规模 备注 约定
1 n=3n=3 k=2k=2   0<wi10110<wi≤1011
2 n=5n=5 k=2k=2  
3 n=16n=16 k=2k=2 所有 wiwi 均相等
4 n=1000n=1000 k=2k=2 wiwi 在取值范围内均匀随机
5 n=1000n=1000 k=2k=2  
6 n=100000n=100000 k=2k=2  
7 n=100000n=100000 k=2k=2 所有 wiwi 均相等
8 n=100000n=100000 k=2k=2  
9 n=7n=7 k=3k=3  
10 n=16n=16 k=3k=3 所有 wiwi 均相等
11 n=1001n=1001 k=3k=3 所有 wiwi 均相等
12 n=99999n=99999 k=4k=4 所有 wiwi 均相等
13 n=100000n=100000 k=4k=4  
14 n=100000n=100000 k=4k=4  
15 n=1000n=1000 k=5k=5  
16 n=100000n=100000 k=7k=7 wiwi 在取值范围内均匀随机
17 n=100000n=100000 k=7k=7  
18 n=100000n=100000 k=8k=8 wiwi 在取值范围内均匀随机
19 n=100000n=100000 k=9k=9  
20 n=100000n=100000 k=9k=9  

对于所有数据,保证 2n1000002≤n≤1000002k92≤k≤9

选手请注意使用 64 位整数进行输入输出、存储和计算。

时间限制:1s1s

空间限制:512MB512MB

评分方式

对于每个测试点:

若输出文件的第 11 行正确,得到该测试点 40% 的分数;

若输出文件完全正确,得到该测试点 100% 的分数。

其实这道题就是一道裸的k叉哈夫曼树,哈夫曼树具体去搜吧。哈夫曼树主要应用于哈弗曼编码,为了不歧义且使编码长度最小,不歧义这一点可以通过根节点路径决定,所以是最多的越靠上就行了。对于k叉哈夫曼树的构建,我们每次选择权值最小的几个节点,并合并,然后就是一道裸题了,关键是谁知道有哈夫曼树这个东西啊

注意就是开始要加入空点

#include <bits/stdc++.h>
typedef long long ll;
#define pa pair<ll,ll>
using namespace std;
priority_queue< pa, vector<pa>, greater<pa> > q;
int n, k; pa ans, now;
int main(){
	cin>>n>>k;
	for( int i = 1; i <= n; i++ ){
		ll x; scanf( "%lld", &x );
		q.push( make_pair( x, 0 ) );
	}
	while( q.size() != 1 ){
		now.first = now.second = 0;
		for( int i = 1; i <= k; i++ ){
			pa z = q.top(); q.pop();
			now.first += z.first;
			now.second = max( now.second, z.second + 1 );
		}
		ans.first += now.first;
		ans.second = max( ans.second, now.second );
		q.push(now);
	}
	printf( "%lld\n%lld", ans.first, ans.second );
	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值