NOI 2015 荷马史诗 (哈夫曼树)

本文介绍了NOI 2015竞赛中关于哈夫曼树的问题,Allison希望通过哈夫曼编码将《荷马史诗》变得更短,要求编码字符串互不为前缀。文章讨论了解决方案,包括构建多叉哈夫曼树的过程,并提供了样例输入和输出。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【NOI2015 Day2】荷马史诗

问题描述

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入格式

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出格式

输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

样例输入1:

4 2
1
1
2
2

样例输入2:

6 3
1
1
3
3
9
9

样例输出1:

12
2

样例输出2:

36
3


此题的解是多叉哈夫曼树,哈夫曼树是用于解决最短编码的一种编码方法。

首先,将每种字符视为点,出现次数视为点权,那么每次选取权最小的k个点合成一个新点,新点点权等于各点点权和,如此最后只剩一个点时,就构好了k叉哈夫曼树,至于具体的编码,举个例子说明即可。
这里写图片描述
如上图的二叉哈夫曼树,那么a的编码为00,b的编码为01,c的编码为1

至于最长编码的最短长度,实际上就是要求哈夫曼树的深度尽量小,那么只需要每次选权值最小且深度深度尽量小的子树合并即可。

具体实现时,可以将点分成已合并的点和未合并的点,维护两个队列的单调性,每次取队首即可。


代码:

#include<stdio.h>
#include<iostream>
#include<algorithm>
#define N 10000005
#define int long long
using namespace std;
struct node{int v,sum,x,dep;}A[N],B[N];
bool operator<(node a,node b)
{
    if(a.v==b.v)return a.dep<b.dep;
    return a.v<b.v;
}
int n,k,l1=1,r1,l2=1,r2;
main()
{
    int i,j;node tmp;
    scanf("%lld%lld",&n,&k);
    for(i=1;i<=n;i++)
    {
        scanf("%lld",&A[++r1].v);
        A[r1].x=A[r1].v;
    }
    if((n-1)%(k-1))r1+=k-1-(n-1)%(k-1);
    sort(A+l1,A+r1+1);
    while(r1-l1+r2-l2+2>1)
    {
        i=0;tmp.sum=tmp.v=tmp.x=tmp.dep=0;
        while(i<k)
        {
            if(l1>r1)
            {
                tmp.v+=B[l2].v;
                tmp.sum+=B[l2].sum+B[l2].x;
                tmp.x+=B[l2].x;
                tmp.dep=max(tmp.dep,B[l2].dep+1);
                l2++;
            }
            else if(l2>r2)
            {
                tmp.v+=A[l1].v;
                tmp.sum+=A[l1].sum+A[l1].x;
                tmp.x+=A[l1].x;
                tmp.dep=max(tmp.dep,A[l1].dep+1);
                l1++;
            }
            else if(A[l1]<B[l2])
            {
                tmp.v+=A[l1].v;
                tmp.sum+=A[l1].sum+A[l1].x;
                tmp.x+=A[l1].x;
                tmp.dep=max(tmp.dep,A[l1].dep+1);
                l1++;
            }
            else
            {
                tmp.v+=B[l2].v;
                tmp.sum+=B[l2].sum+B[l2].x;
                tmp.x+=B[l2].x;
                tmp.dep=max(tmp.dep,B[l2].dep+1);
                l2++;
            }
            i++;
        }
        B[++r2]=tmp;
    }
    printf("%lld\n%lld",B[l2].sum,B[l2].dep);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值