Distinct Subsequences

本文介绍了一种使用动态规划解决字符串子序列匹配问题的方法,通过构建矩阵来追踪两个字符串间可能的子序列数量。

Given a string S and a string T, count the number of distinct subsequences of T in S.

A subsequence of a string is a new string which is formed from the original string by deleting some (can be none) of the characters without disturbing the relative positions of the remaining characters. (ie, "ACE" is a subsequence of "ABCDE" while "AEC" is not).

Here is an example:
S = "rabbbit"T = "rabbit"

Return 3.

Show Tags

Have you met this question in a real interview?


 这道题首先引用我忘记在哪里看到的一句话:

 “When you see string problem that is about subsequence or matching, dynamic programming method should come to your mind naturally. ”

 所以这种类型题可以多往DP思考思考。

思路不是很明显的时候,可以画图表。


画图之后,可以观察,得到规律:

左边是S,上面是 T.

matrix[i][j] 表示:S在i,  T在j 的时候,S能够表示T的种数。

if S[i] != T[j] 的时候, matrix[i][j] = matrix[i-1][j] 也就是说,like: S abc  T a, 当move到b的时候,b的个数就等于a which is 1, c的个数也等于a which is 1.

if S[i] == T[j] , matrix[i][j] = matrix[i-1][j] + matrix[i-1][j-1].这点是从图中

2  1

    3

推理出来的。可以理解为: S[i] == T[j] 了,数目可以由原来的,各自倒退一步,S[i-1] T[j-1]的数目, + matrix[i-1][j]

因为matrix[i][j] 的数目,至少是matrix[i-1][j] 这个看矩阵第二列,也就是T=r那一列。全部是:

1

1

1

1

1

1

S = rabbit  T = r

递推的base:

S="", T 这一行全部是0

T="", S 这一列全部是1,因为""为任何string的sequence,just delete this string will get ""


看不懂就看看这个: http://blog.youkuaiyun.com/abcbc/article/details/8978146

public class Solution {
    public int numDistinct(String S, String T) {
        if(S == null || T == null || T.length()>S.length()){return 0;}
        int[][] matrix = new int[S.length()+1][T.length()+1];
        
        // "" is 1 sequence of "";
        matrix[0][0] = 1;
        
        //init 1st col; T is "";
        for(int i=1; i<S.length()+1; i++){
            matrix[i][0] = 1;
        }
        
        //init 1st row; S is "";
        for(int i=1; i<T.length()+1; i++){
            matrix[0][i] = 0;
        }
        
        for(int i=1; i<S.length()+1; i++){
            for(int j=1; j<T.length()+1; j++){
                if(S.charAt(i-1) == T.charAt(j-1)){
                    matrix[i][j] = matrix[i-1][j]+matrix[i-1][j-1];
                }else{
                    matrix[i][j] = matrix[i-1][j];
                }
            }
        }
        return matrix[S.length()][T.length()];
    }
}
### 关于回文子序列的算法及其示例 #### 定义与概念 回文是指正读和反读都相同的字符序列。对于给定字符串中的任意字符组合形成的子序列,如果该子序列满足上述条件,则称为回文子序列。 #### 动态规划求解最长回文子序列 为了找到一个字符串中最长的回文子序列,可以采用动态规划的方法来解决这个问题。设 `dp[i][j]` 表示从第 i 到 j 的子串内的最长回文子序列长度: - 当 s[i]==s[j] 时, dp[i][j]=dp[i+1][j−1]+2; - 否则, dp[i][j]=max(dp[i+1][j],dp[i][j−1]). 最终的结果保存在 `dp[0][len(s)-1]` 中[^3]. ```python def longest_palindromic_subseq(s: str) -> int: n = len(s) # 创建二维数组用于存储中间结果 dp = [[0]*n for _ in range(n)] # 初始化单个字符的情况 for i in range(n): dp[i][i] = 1 # 填充表格 for length in range(2, n + 1): for start in range(n - length + 1): end = start + length - 1 if s[start] == s[end]: dp[start][end] = dp[start+1][end-1] + 2 else: dp[start][end] = max(dp[start+1][end], dp[start][end-1]) return dp[0][-1] ``` 此方法的时间复杂度为 O(n²),空间复杂度同样为 O(n²). #### 枚举所有可能的回文子序列 除了寻找最长的回文子序列外,还可以通过枚举的方式找出所有的不同回文子序列。这种方法适用于较短的输入字符串,并且可以通过位掩码技术实现高效的遍历。 ```python from collections import defaultdict def count_distinct_palindrome_subsequences(text: str) -> list[str]: results = set() memo = {} def backtrack(start=0, path=""): nonlocal text, results, memo key = (start, path) if key not in memo: temp_set = {path} if path == path[::-1] else {} for index in range(start, len(text)): new_path = path + text[index] if new_path == new_path[::-1]: temp_set.add(new_path) temp_set |= backtrack(index + 1, new_path) memo[key] = temp_set results.update(memo[(start, path)]) return memo[(start, path)] backtrack() return sorted(list(results)) ``` 这段代码会返回按字典序排列的不同回文子序列列表.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值