CCF CSP 2016年12月第4题压缩编码（区间DP）

最新推荐文章于 2025-06-20 14:08:07 发布

nudt_oys

最新推荐文章于 2025-06-20 14:08:07 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：动态规划备战CCF计算机职业资格认证文章标签： CCF CSP

本文链接：https://blog.youkuaiyun.com/qq_26658823/article/details/78194791

动态规划同时被 2 个专栏收录

32 篇文章

订阅专栏

备战CCF计算机职业资格认证

14 篇文章

订阅专栏

该博客主要解析2016年CCF CSP的一道题目，涉及区间动态规划（DP）解决压缩编码问题。作者指出，由于需要保证编码长度最小且有序，Huffman编码不适用。通过将问题转化为石子归并问题，作者建立了状态转移方程dp[i, j] = min(dp[i, j], dp[i, k] + dp[k+1, j] + sum[i, j])，并提供了相应的代码实现。" 127435117,8269990,PAT乙级1069微博转发抽奖算法解析,"['算法', '数据结构', 'C语言', 'PAT考试']

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

试题编号：	201612-4
试题名称：	压缩编码
时间限制：	3.0s
内存限制：	256.0MB
问题描述：	问题描述　　给定一段文字，已知单词a₁, a₂, …, a_n出现的频率分别t₁, t₂, …, t_n。可以用01串给这些单词编码，即将每个单词与一个01串对应，使得任何一个单词的编码（对应的01串）不是另一个单词编码的前缀，这种编码称为前缀码。　　使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为：　　L=a₁的编码长度×t₁+a₂的编码长度×t₂+…+ a_n的编码长度×t_n。　　定义一个前缀编码为字典序编码，指对于1 ≤ i < n，a_i的编码（对应的01串）的字典序在a_i₊₁编码之前，即a₁, a₂, …, a_n的编码是按字典序升序排列的。　　例如，文字E A E C D E B C C E C B D B E中， 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5，则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11，对应的编码后的01串为1100011011011001010111010011000111，对应的长度L为3×1+3×3+2×4+2×2+2×5=34。　　在这个例子中，如果使用哈夫曼(Huffman)编码，对应的编码方案是A:000, B:01, C:10, D:001, E:11，虽然最终文字编码后的总长度只有33，但是这个编码不满足字典序编码的性质，比如C的编码的字典序不在D的编码之前。　　在这个例子中，有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1，编码后的文字长度为35。　　请找出一个字典序编码，使得文字经过编码后的长度L最小。在输出时，你只需要输出最小的长度L，而不需要输出具体的方案。在上面的例子中，最小的长度L为34。输入格式　　输入的第一行包含一个整数n，表示单词的数量。　　第二行包含n个整数，用空格分隔，分别表示a₁, a₂, …, a_n出现的频率，即t₁, t₂, …, t_n。请注意a₁, a₂, …, a_n具体是什么单词并不影响本题的解，所以没有输入a₁, a₂, …, a_n。输出格式　　输出一个整数，表示文字经过编码后的长度L的最小值。样例输入 5 1 3 4 2 5 样例输出 34 样例说明　　这个样例就是问题描述中的例子。如果你得到了35，说明你算得有问题，请自行检查自己的算法而不要怀疑是样例输出写错了。评测用例规模与约定　　对于30%的评测用例，1 ≤ n ≤ 10，1 ≤ t_i ≤ 20；　　对于60%的评测用例，1 ≤ n ≤ 100，1 ≤ t_i ≤ 100；　　对于100%的评测用例，1 ≤ n ≤ 1000，1 ≤ t_i ≤ 10000。

解题思路：第一次看到这道题的时候，我还是有点懵逼的。本来想着先用Huffman来做，然后再排个序，后来发现事情并没有这么简单。因为要求编码长度最小并且是字典序，而Huffman压缩是每次都合并当前最小的两个数，这就导致了最终编码的无序性，所以只有每次合并相邻的两个数才能保证字典序，每一次合并的代价是相邻两个数之和。诶，这不就是一个石子归并的问题吗，令dp[i, j]表示合并区间[i, j]里的所有数字的最小代价，很显然，dp[i, i] = 0；而dp[i, j] = min(dp[i, j],dp[i, k] + dp[k+1, j] + sum[i, j])。有了状态转移方程，代码就很好写了。

代码如下：

#include <cstdio>
#include <climits>
#include <cstring>
#include <algorithm>
#define MAXN 1005

using namespace std;

int dp[MAXN][MAXN];
int sum[MAXN],arr[MAXN];

int main(void) {
    int n;
    while(scanf("%d",&n) != EOF) {
        memset(sum,0,sizeof(sum));
        for(int i = 1; i <= n; i++) {
            scanf("%d",&arr[i]);
            sum[i] = sum[i - 1] + arr[i];
        }
        memset(dp,0,sizeof(dp));
        for(int t = 1; t < n; t++) {
            for(int i = 1; i <= n - t; i++) {
                int j = i + t;
                dp[i][j] = INT_MAX;
                for(int k = i; k < j; k++) {
                    dp[i][j] = min(dp[i][j],dp[i][k] + dp[k+1][j] + sum[j] - sum[i-1]);
                }
            }
        }
        printf("%d\n",dp[1][n]);
    }
    return 0;
}