题目:给定一段文字,已知单词a1, a2, …,
an出现的频率分别t1, t2, …,
tn。可以用01串给这些单词编码,即将每个单词与一个01串对应,使得任何一个单词的编码(对应的01串)不是另一个单词编码的前缀,这种编码称为前缀码。
使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为:
L=a1的编码长度×t1+a2的编码长度×t2+…+
an的编码长度×tn。
定义一个前缀编码为字典序编码,指对于1 ≤ i < n,ai的编码(对应的01串)的字典序在ai+1编码之前,即a1,
a2, …, an的编码是按字典序升序排列的。
例如,文字E A E C D E B C C E C B D B E中, 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5,则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11,对应的编码后的01串为1100011011011001010111010011000111,对应的长度L为3×1+3×3+2×4+2×2+2×5=34。
在这个例子中,如果使用哈夫曼(Huffman)编码,对应的编码方案是A:000, B:01, C:10, D:001, E:11,虽然最终文字编码后的总长度只有33,但是这个编码不满足字典序编码的性质,比如C的编码的字典序不在D的编码之前。
在这个例子中,有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1,编码后的文字长度为35。
请找出一个字典序编码,使得文字经过编码后的长度L最小。在输出时,你只需要输出最小的长度L,而不需要输出具体的方案。在上面的例子中,最小的长度L为34。
思路:这道题首先你要懂得哈夫曼树的原理,即编码原理,然后找到区别,哈夫曼树是每次找最小的两个,和的价值为新的价值,然后再找到最小的两个价值,组成新的价值,其实就是贪心的依次取最小两个数;但是这里因为要满足字母序,所以只能和相邻的值合并,联想到DP中 的石子合并的问题。
但是普通的石子合并算法复杂度为O(n^3),不能满足这道题的规模,因此要用四边形规则优化。
#include<iostream>
#include<algorithm>
using namespace std;
#define maxn 1000+5
const int INF = (1 << 30);
int dp[maxn][maxn], a[maxn], sum[maxn];
int s[maxn][maxn];
int main()
{
int n,i,j,start,mink,end,k;
int temp;
cin >> n;
sum[0] = 0;
for (i = 1; i <= n; i++)
{
cin >> a[i];
sum[i] = sum[i - 1] + a[i];
s[i][i] = i;
}
for (int len = 1; len < n; len++)
{
for (start = 1; start <= n - len; start++)
{
mink = start;
temp = INF;
end = start + len;
for (k = s[start][end - 1]; k <= s[start + 1][end]; k++)//优化
{
if (temp > (dp[start][k] + dp[k+1][end] + sum[end] - sum[start-1]))
{
mink = k;//找到k值
temp = (dp[start][k] + dp[k+1][end] + sum[end] - sum[start-1]);
}
}
s[start][end] = mink;
dp[start][end] = temp;
}
}
cout << dp[1][n];
system("pause");
return 0;
}