给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。
进阶:
如果有大量输入的 S,称作 S1, S2, … , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
思考:
方法一:双指针
class Solution {
public:
bool isSubsequence(string s, string t) {
int index = 0;
if(s == t) return true;
for (int i = 0; i < t.length(); i++){
if (s[index] == t[i]) index++;
if (index == s.length()) return true;
}
return false;
}
};
但显然这无法解决进阶的问题。
方法二:动态规划
我们发现双指针法中花费了大量时间用于在t中寻找下一个匹配字符,这样我们可以预处理出对于t的每一个位置,从该位置开始往后每一个字符第一次出现的位置。
我们可以使用动态规划的方法实现预处理,令f[i][j]f[i][j]f[i][j]表示字符串t中从位置i开始往后字符j第一次出现的位置。
由于该解法中对t的处理与s无关,且预处理完成后,可以利用预处理数组的信息,线性地算出任意一个字符串s是否为t的子串。这就可以解决进阶的问题。
class Solution {
public:
bool isSubsequence(string s, string t) {
int n = s.size(), m = t.size();
// dp数组dp[i][j]表示字符串t以i位置开始第一次出现字符j的位置
vector<vector<int> > dp(m + 1, vector<int>(26, 0));
// 初始化边界条件,dp[i][j] = m表示t中不存在字符j
for (int i = 0; i < 26; i++) {
dp[m][i] = m;
}
// 从后往前递推初始化dp数组
for (int i = m - 1; i >= 0; i--) {
for (int j = 0; j < 26; j++) {
if (t[i] == j + 'a')
dp[i][j] = i;
else
// 这里不是m就是i
dp[i][j] = dp[i + 1][j];
}
}
int add = 0;
for (int i = 0; i < n; i++) {
// t中没有s[i] 返回false
if (dp[add][s[i] - 'a'] == m) {
return false;
}
// 否则直接跳到t中s[i]第一次出现的位置之后一位
add = dp[add][s[i] - 'a'] + 1;
}
return true;
}
};