k叉哈夫曼树(bzoj-4198荷马史诗)

本文探讨了k叉哈夫曼树在文本编码优化中的应用,特别是针对《荷马史诗》的编码问题,提出了通过增加虚拟节点使叶节点总数符合特定形式,以构造最优k叉哈夫曼树的方法,实现对长篇文献的有效压缩。

k叉哈夫曼树在ACM中的最常用的应用就是求合并n个数最小的代价。

哈夫曼树也可以是k叉的,只是在构造k叉哈夫曼树时需要先进行一些调整。构造哈夫曼树的思想是每次选k个权重最小的元素来合成一个新的元素,该元素权重为k个元素权重之和。但是当k大于2时,按照这个步骤做下去可能到最后剩下的元素少于k个。

解决这个问题的办法是假设已经有了一棵哈夫曼树(且为一棵满k叉树),则可以计算出其叶节点数目为(k-1)nk+1,式子中的nk表示子节点数目为k的节点数目。于是对给定的n个权值构造k叉哈夫曼树时,可以先考虑增加一些权值为0的叶子节点,使得叶子节点总数为(k-1)nk+1这种形式,然后再按照哈夫曼树的方法进行构造即可。

对于 k 叉树,设 m 为叶子数 , 若 ( m - 1 ) % ( k - 1 ) != 0 , 要增加虚(子叶)结点。第一次构造用 ( m - 1 ) % ( k - 1 ) + 1 个结点,之后都用 k 个结点构造 k 叉树。

以上分析来自:https://blog.youkuaiyun.com/dt2131/article/details/73469866

 

E - 荷马史诗

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:

对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。

现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?

一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。

字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

Input

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

Output

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

Sample Input

4 2 1 1 2 2

Sample Output

12 2

Hint

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:

1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。

一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:

1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。

对于所有数据,保证 2≤n≤100000,2≤k≤9。

选手请注意使用 64 位整数进行输入输出、存储和计算。

ac:

#include<bits/stdc++.h>
#define LL long long
using namespace std;
int n,k,mx;
LL ans;

struct node{
    LL val;
    int siz;
    bool operator <(const node other)const
    {
        if (val==other.val)
            return siz>other.siz;
        return val>other.val;
    }
}a[100005],b,x;

priority_queue <node> que;

main()
{
    scanf("%d%d",&n,&k);
    for (int i=1;i<=n;++i)
    {
        scanf("%lld",&a[i].val);
        que.push(a[i]);
    }
    while ((n-1)%(k-1)&&k>2)//可以先考虑增加一些权值为0的叶子节点,使得叶子节点总数为(k-1)nk+1这种形式,
        ++n,que.push(node{0,0});//然后再按照哈夫曼树的方法进行构造即可。
    while(que.size()!=1)
    {
        b.val=b.siz=0;
        for (int i=1;i<=k;++i)//模拟插入k个结点
        {
            x=que.top(),que.pop();
            b.val+=x.val;
            b.siz=max(b.siz,x.siz+1);
        }
        ans+=b.val;
        mx=max(mx,b.siz);
        que.push(b);
    }
    printf("%lld\n%d\n",ans,mx);
}

 

 

 

 

转载于:https://www.cnblogs.com/wangtao971115/p/10358257.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值