判断子序列（392）

最新推荐文章于 2022-06-15 08:35:49 发布

原创最新推荐文章于 2022-06-15 08:35:49 发布 · 111 阅读

CC 4.0 BY-SA版权

给定字符串 s 和 t ，判断 s 是否为 t 的子序列。
字符串的一个子序列是原始字符串删除一些（也可以不删除）字符而不改变剩余字符相对位置形成的新字符串。（例如，"ace"是"abcde"的一个子序列，而"aec"不是）。
进阶：
如果有大量输入的 S，称作 S1, S2, … , Sk 其中 k >= 10亿，你需要依次检查它们是否为 T 的子序列。在这种情况下，你会怎样改变代码？

思考：
方法一：双指针

class Solution {
public:
    bool isSubsequence(string s, string t) {
        int index = 0;
        if(s == t) return true;
        for (int i = 0; i < t.length(); i++){
            if (s[index] == t[i]) index++;
            if (index == s.length()) return true;
        }
        return false;
    }
};

但显然这无法解决进阶的问题。
方法二：动态规划
我们发现双指针法中花费了大量时间用于在t中寻找下一个匹配字符，这样我们可以预处理出对于t的每一个位置，从该位置开始往后每一个字符第一次出现的位置。
我们可以使用动态规划的方法实现预处理，令 $f [i] [j]$ 表示字符串t中从位置i开始往后字符j第一次出现的位置。
由于该解法中对t的处理与s无关，且预处理完成后，可以利用预处理数组的信息，线性地算出任意一个字符串s是否为t的子串。这就可以解决进阶的问题。

class Solution {
public:
    bool isSubsequence(string s, string t) {
        int n = s.size(), m = t.size();
		// dp数组dp[i][j]表示字符串t以i位置开始第一次出现字符j的位置
        vector<vector<int> > dp(m + 1, vector<int>(26, 0));
        // 初始化边界条件，dp[i][j] = m表示t中不存在字符j
        for (int i = 0; i < 26; i++) {
            dp[m][i] = m;
        }
		// 从后往前递推初始化dp数组
        for (int i = m - 1; i >= 0; i--) {
            for (int j = 0; j < 26; j++) {
                if (t[i] == j + 'a')
                    dp[i][j] = i;
                else
                	// 这里不是m就是i
                    dp[i][j] = dp[i + 1][j];
            }
        }
        int add = 0;
        for (int i = 0; i < n; i++) {
        	// t中没有s[i] 返回false
            if (dp[add][s[i] - 'a'] == m) {
                return false;
            }
            // 否则直接跳到t中s[i]第一次出现的位置之后一位
            add = dp[add][s[i] - 'a'] + 1;
        }
        return true;
    }
};