leetcode之distinct-subsequences(求字符串中子串的数量)
题目
Given a string S and a string T, count the number of distinct subsequences of T in S.
A subsequence of a string is a new string which is formed from the original string by deleting some (can be none) of the characters without disturbing the relative positions of the remaining characters. (ie,"ACE"is a subsequence of"ABCDE"while"AEC"is not).
Here is an example:
S =“rabbbit”, T =“rabbit”
Return 3.
题意
给定两个字符串,分别是字符串T和字符串S,T是母串,S是子串。求T中由多少种可以组成S这个子串的组合?
例如:S=“rabbbit” T = “rabbit”
则返回值为3.
解题思路
这一题是典型的动态规划题目,求某字符串中的对应子串个数,我们首先要找到其中的规律,我们用dp[i][j]来表示长度为
i的子和长度为j的母串的数量,则:
dp[0][j]=1,因为i=0,表示子串长度为0,那么这时候肯定对应的数量肯定是1;
然后如果当母串和子串的最后一位字符不相等时,则:
**dp[i][j] = dp[i][j-1] ** 因为反正不相等,母串的长度为j或者母串长度为j-1,没有任何区别,切掉最后一位没有任何影响;
然而当 母串和子串的最后一位相等时,则此时:
dp[i][j] = dp[i][j-1]+dp[i-1][j-1].
这里怎么理解呢,是这样的,如何最后一位相等,则有两种情况:
1、 最后的若干个子串里面的确包含了最后一位字符,则这些子串的数量是dp[i-1][j-1],相当于同时切掉了子串和母串的最后一位字符, 比如说 母串为:“catb” 子串为“atb”,则这个时候,子串数量就等于是"atb"与"tb";
2、还有一些子串,是不包含母串最后面那个字符的,则此时数量为dp[i][j-1].相当于还是用长度为i的子字符串去匹配长度为j-1的母串。
最后有以下代码实现步骤:
C++代码实现
这里要明确定义的dp[i][j]是i为子串长度,j为母串长度,所以定义二维数组的时候,一定是i*j的二维矩阵,也就是i定义了行数,j定义了列数。也就是子串的长度定义了行数,母串的长度定义了列数。
这里千万不能混淆。
class Solution {
public:
int numDistinct(string S, string T) { //S是母串 T是子串
int m = T.length(); //m是子串的长度
int n = S.length(); //n是母串的长度
//准备定义个dp[i][j],其中j是母串的长度,i是子串的长度,所以这里首先定义有m+1行,再定义列,有n+1的列
int** dp = new int* [m+1];
for(int i=0;i<m+1;i++){
dp[i] = new int[n+1];
}
for(int j=0;j<n;j++){
dp[0][j]=1; //定义初始值,当i也就是母串为0的时候,dp[0][j]=1是恒成立的 子串为0,所有次数都是1
}
for(int i=1;i<m+1;i++){
for(int j=1;j<n+1;j++){
if(S[j-1] ==T[i-1]){
dp[i][j]=dp[i][j-1]+dp[i-1][j-1];
}else{
dp[i][j]=dp[i][j-1];
}
}
}
return dp[m][n];
}
};