(刷题笔记) Leetcode 面试题 17.13. 恢复空格

本文介绍了一种使用动态规划解决字符串切分问题的方法,目标是最小化未被字典识别的字符数量。通过实例演示了如何将一个连续的字符串按词典中的词汇进行最优切分。

题目

哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。

注意:本题相对原题稍作改动,只需返回未识别的字符数

示例:

输入:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。

提示:

0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/re-space-lcci

解题思路

一开始写的时候没注意提干要求未识别的字符最少,就很规矩的写了个拆分的代码,然后只能过30个测试用例。
后面看了一下解答区,因为没接触过字典树,所以没看这方面的解法。
动态规划的写法还比较好懂,递推公式就是 在没有匹配的情况下 dp[i]=dp[i-1]+1; 在有匹配的情况下,取最大匹配 dp[i]=min(dp[i],dp[i-len]);

代码(C++)

class Solution {
public:
    int respace(vector<string>& dictionary, string sentence) {

       int sen_len=sentence.size();
       vector<int> dp(sen_len+1);
       dp[0]=0;

       for(int i=1;i<=sen_len;++i){

           dp[i]=dp[i-1]+1;

           for(int j=0;j<dictionary.size();++j){

               int len=dictionary[j].size();
               if(i>=len){

                   if(sentence.substr(i-len,len)==dictionary[j]){
                       dp[i]=min(dp[i],dp[i-len]);
                   }
               }
           }
       }

       return dp[sen_len];
    }
};
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值