【NOI2015】荷马史诗 - 哈夫曼树

本文介绍了一种基于哈夫曼树的编码方法,用于压缩《荷马史诗》中的文字内容。通过对不同频率的单词使用不同长度的k进制字符串进行替换,实现了文本的高效压缩。文章提供了一个具体的实现方案,并附带源代码。

题目描述

追逐影子的人,自己就是影子 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》 组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有n种不同的单词,从1到n进行编号。其中第i种单 词出现的总次数为wi。Allison 想要用k进制串si来替换第i种单词,使得其满足如下要求:

对于任意的 1 ≤ i, j ≤ n , i ≠ j ,都有:si不是sj的前缀。

现在 Allison 想要知道,如何选择si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的si的最短长度是多少?

一个字符串被称为k进制字符串,当且仅当它的每个字符是 0 到 k − 1 之间(包括 0 和 k − 1 )的整数。

字符串 str1 被称为字符串 str2 的前缀,当且仅当:存在 1 ≤ t ≤ m ,使得str1 = str2[1..t]。其中,m是字符串str2的长度,str2[1..t] 表示str2的前t个字符组成的字符串。

输入输出格式

输入格式:

 

输入的第 1 行包含 2 个正整数 n, k ,中间用单个空格隔开,表示共有 n种单词,需要使用k进制字符串进行替换。

接下来n行,第 i + 1 行包含 1 个非负整数wi ,表示第 i 种单词的出现次数。

 

输出格式:

 

输出包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

 

思路

其实就是构造一个k进制的哈夫曼树,用一个优先队列维护就行了

#include <bits/stdc++.h>
using namespace std;
const int maxn = 100000 + 10;
typedef long long ll;
struct Heap {
    ll w,h;
    inline bool operator < (Heap cmp) const {
        if (w != cmp.w) return w > cmp.w; 
        return h > cmp.h;
    }
};
priority_queue<Heap> Q;
ll n,k,ans;
int main() {
    scanf("%lld%lld",&n,&k);
    for (ll i = 1,x;i <= n;i++) {
        scanf("%lld",&x);
        Q.push((Heap){x,1});
    }
    if ((n-1)%(k-1)) for (ll i = 1;i <= k-1-(n-1)%(k-1);i++) Q.push((Heap){0,1});
    ll cnt = n;
    while (cnt > 1) {
        ll sum = 0,Max = 0;
        for (ll i = 1;i <= k;i++) {
            sum += Q.top().w;
            Max = max(Max,Q.top().h);
            Q.pop();
        }
        ans += sum;
        Q.push((Heap){sum,Max+1});
        cnt -= k-1;
    }
    printf("%lld\n%lld",ans,Q.top().h-1);
    return 0;
}

 

转载于:https://www.cnblogs.com/lrj124/p/8659993.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值