题目描述:
已知:给定一个字符串S和一个字典D(内含w个单词)。删除S中若干字符后(记此操作为F),可形成由D中的单词组成的新序列S‘(长度为0的空序列同样视为满足要求)
求:操作F需要删除的最小字符个数
输入:第1行为两个正整数W(1≤W≤600)和L(2≤L≤300),分别代表D中单词的个数和S的长度;第2行为字符串S;第3行至第W+2行为D中的W个单词
输出:操作F需删除的最小字符个数
Sample Input:
6 10
browndcodw
cow
milk
while
black
brown
farmer
Sample Output:
2
思路:
设序列S为(c1, c2, ..., cl),Ti表示从元素ci至cl的子串(ci, ci+1, ..., cl),则Tl=(cl),T1=S
设代价函数e[i]为Ti进行操作F需删除的最小字符数,则不难得到如下递归表达式
其中,cnt(i, j)表示对序列(ci, ci+1, ..., cj)进行操作F需删除的字符数
可见原问题满足最优子结构,考虑用DP
代码:
#include <stdio.h>
#include <limits.h>
#include <string.h>
int w, l;
char dict[610][32];
char seq[310];
int e[310];
int cnt; //保存cnt(i,j)
int ee; //保存min{cnt(i,j)+e(j+1)}
int dl; //保存当前匹配单词dict[di]的长度
int dp(){
for(int i = 0; i < l; i++) //初始化,视Ti均不匹配
e[i] = l-i;
for(int i = l-2; i >= 0; i--){
ee = INT_MAX; //ee值初始化为INT_MAX,则不需要再判断Ti是否与任意单词匹配
for(int di = 0; di < w; di++){
dl = strlen(dict[di]);
cnt = 0;
int j = i;
int dj = 0;
if(seq[j] != dict[di][0]) //若Ti首字母与单词首字母不相等,则continue,节省时间
continue;
while(j < l && dj < dl && (l-j)>=(dl-dj)){ //匹配结束的三种情况:1.Ti扫描完毕 2.当前单词扫描完毕 3.Ti剩余字符数少于单词剩余字符数
if(seq[j] == dict[di][dj]){
j++;
dj++;
}
else{
j++;
cnt++;
}
}
if(dj == dl) //dj==dl表示单词扫描完毕,即单词匹配成功,则保存ee与当前cnt+e[j]中较小的那个为新的ee值
ee = ((cnt+e[j]) < ee) ? (cnt+e[j]) : ee;
}
e[i] = ((e[i+1]+1) < ee) ? (e[i+1]+1) : ee; //整部字典扫描完毕后,取e[i+1]+1与ee中较小的那个为e[i]
}
return e[0]; //e[0]即为原问题的解
}
int main(){
scanf("%d%d", &w, &l);
scanf("%s", seq);
for(int i = 0; i < w; i++)
scanf("%s", dict[i]);
printf("%d\n", dp());
return 0;
}