题目
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
注意:本题相对原题稍作改动,只需返回未识别的字符数
示例:
输入:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。
提示:
0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/re-space-lcci
解题思路
一开始写的时候没注意提干要求未识别的字符最少,就很规矩的写了个拆分的代码,然后只能过30个测试用例。
后面看了一下解答区,因为没接触过字典树,所以没看这方面的解法。
动态规划的写法还比较好懂,递推公式就是 在没有匹配的情况下 dp[i]=dp[i-1]+1; 在有匹配的情况下,取最大匹配 dp[i]=min(dp[i],dp[i-len]);
代码(C++)
class Solution {
public:
int respace(vector<string>& dictionary, string sentence) {
int sen_len=sentence.size();
vector<int> dp(sen_len+1);
dp[0]=0;
for(int i=1;i<=sen_len;++i){
dp[i]=dp[i-1]+1;
for(int j=0;j<dictionary.size();++j){
int len=dictionary[j].size();
if(i>=len){
if(sentence.substr(i-len,len)==dictionary[j]){
dp[i]=min(dp[i],dp[i-len]);
}
}
}
}
return dp[sen_len];
}
};
本文介绍了一种使用动态规划解决字符串切分问题的方法,目标是最小化未被字典识别的字符数量。通过实例演示了如何将一个连续的字符串按词典中的词汇进行最优切分。

被折叠的 条评论
为什么被折叠?



