1. 相关表示
符号 | 含义 | 备注 |
---|---|---|
S[n]S[n]S[n] | 表示长度为n的字符串 | |
S[n][n]S[n][n]S[n][n] | 二维状态数组二维状态数组二维状态数组 | S[i][j]表示前i个字符组成的distinctsubsequences的个数,且该subsequences的长度为j+1(从0开始)S[i][j]表示前i个字符组成的distinct subsequences的个数,且该subsequences的长度为j+1(从0开始)S[i][j]表示前i个字符组成的distinctsubsequences的个数,且该subsequences的长度为j+1(从0开始) |
P[n]P[n]P[n] | 辅助数组辅助数组辅助数组 | P[i]表示距离字符S[i]最近且S[P[i]]==S[i]P[i]表示距离字符S[i]最近且S[P[i]] == S[i]P[i]表示距离字符S[i]最近且S[P[i]]==S[i] |
2. 状态转移方程:
S[i][j]的状态无非和S[i−1][j−1],S[i−1][j]和S[i][j−1]有关。其中,S[i][j−1]可以直接排除,因为它们之间没有状态转移关系。S[i][j]的状态无非和S[i-1][j-1],S[i-1][j]和S[i][j-1]有关。其中,S[i][j-1]可以直接排除,因为它们之间没有状态转移关系。S[i][j]的状态无非和S[i−1][j−1],S[i−1][j]和S[i][j−1]有关。其中,S[i][j−1]可以直接排除,因为它们之间没有状态转移关系。
a.S[i−1][j]表示字符串S[n]前i−1个字符包含长度为j+1的distinct subsequences的个数。因为i>i−1,所以S[i][j]包含S[i−1][j]。a. S[i-1][j]表示字符串S[n]前i-1个字符包含长度为j+1的distinct \ subsequences的个数。因为i>i-1,所以S[i][j]包含S[i-1][j]。a.S[i−1][j]表示字符串S[n]前i−1个字符包含长度为j+1的distinct subsequences的个数。因为i>i−1,所以S[i][j]包含S[i−1][j]。
b.S[i−1][j−1]表示字符串S[n]前i−1个字符包含长度为j的distinct subsequences的个数。所以当新增一个字符S[i]时,该字符S[i]同S[i−1][j−1]表示的长度为j的不同的子串可以转换成长度为j+1的子串。b. S[i-1][j-1]表示字符串S[n]前i-1个字符包含长度为j的distinct \ subsequences的个数。所以当新增一个字符S[i]时,该字符S[i]同S[i-1][j-1]表示的长度为j的不同的子串可以转换成长度为j+1的子串。b.S[i−1][j−1]表示字符串S[n]前i−1个字符包含长度为j的distinct subsequences的个数。所以当新增一个字符S[i]时,该字符S[i]同S[i−1][j−1]表示的长度为j的不同的子串可以转换成长度为j+1的子串。
c.因为子串长度为j的S[i−1][j−1]是通过和字符S[i]合并组成子串长度为j+1S[i][j]的一部分,而这新的一部分,可能会同原本长度为j+1的S[i−1][j]的重复。重复的部分有一个共性就是都是以字符S[i]结尾的。所以只要删除S[i−1][j]中以字符S[i]结尾的即可。即删除前i−1个字符中以S[i]为结尾且长度为j+1的子串。c. 因为子串长度为j的S[i-1][j-1]是通过和字符S[i]合并组成子串长度为j+1S[i][j]的一部分,而这新的一部分,可能会同原本长度为j+1的S[i-1][j]的重复。重复的部分有一个共性就是都是以字符S[i]结尾的。所以只要删除S[i-1][j]中以字符S[i]结尾的即可。即删除前i-1个字符中以S[i]为结尾且长度为j+1的子串。c.因为子串长度为j的S[i−1][j−1]是通过和字符S[i]合并组成子串长度为j+1S[i][j]的一部分,而这新的一部分,可能会同原本长度为j+1的S[i−1][j]的重复。重复的部分有一个共性就是都是以字符S[i]结尾的。所以只要删除S[i−1][j]中以字符S[i]结尾的即可。即删除前i−1个字符中以S[i]为结尾且长度为j+1的子串。
具体流程是:先再前i-1个字符找到距离字符S[i]最近且字符等于S[i]的,得到P[i]。P[i]就是该字符的位置。然后可以得到前P[i]-1个字符的长度为j的子串的个数。最后,减去该数。
S[i][j]=S[i−1][j−1]+S[i−1][j]−{0P[i]==−1,0≤i,j<nS[P[i]−1][j−1]P[i]!=−1,0≤i,j<n S[i][j]=S[i-1][j-1] + S[i-1][j] - \left\{ \begin{array}{rcl} 0 & P[i]==-1 ,0\leq i,j \lt n \\ S[P[i]-1][j-1] & P[i]!=-1 ,0\leq i,j \lt n \end{array} \right. S[i][j]=S[i−1][j−1]+S[i−1][j]−{0S[P[i]−1][j−1]P[i]==−1,0≤i,j<nP[i]!=−1,0≤i,j<n
3. 代码
class Solution {
public:
int distinctSubseqII(string S) {
int i,j;
long long int res = 0;
vector<vector<long long int> > vvi(S.size(),vector<long long int>(S.size()));
vector<int> vi1(S.size());
vector<int> vi2('z'-'a'+1,-1);
for(i=0;i<S.size();++i){
vi1[i] = vi2[S[i]-'a'];
vi2[S[i]-'a']=i;
}
vvi[0][0] = 1; // for pos 0 and max length is 1
for(i=1;i<S.size();++i){ //pos start from pos 1
if(vi1[i]==-1){
vvi[i][0] = vvi[i-1][0]+1; //new character
}else{
vvi[i][0] = vvi[i-1][0];
}
for(j=1;j<=i;++j){
vvi[i][j] = vvi[i-1][j-1] + vvi[i-1][j];
if(vi1[i]!=-1){
if(vi1[i] > 0)
vvi[i][j] -= vvi[vi1[i]-1][j-1];
}
vvi[i][j] %= 1000000007;
}
}
for(i=0;i<S.size();++i){
res += vvi[S.size()-1][i];
res %= 1000000007;
}
return res;
}
};