给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入: s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoor" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入: s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
思路:words中每个单词的长度是c,滑动窗口起始位置需要遍历前c个位置。对于每个位置,采用滑动窗口(左右指针)滑动一遍,O(c*s.size())时间复杂度。
1、首先,由于words中的单词可能有重复的,所以说要搞一个哈希表把每一个单词和对应的数量存起来,作为目标哈希表aa。
2、设置左右指针p, q,从s的开头开始遍历,把两个滑动指针中间的字符串及其个数都存到临时哈希表bb中。当aa和bb相等的时候,就说明我们找到了一个目标解。
(1)如果q后面的字符串在目标哈希表中,说明我们找到了一个有效字符串,塞入哈希表,右移q, 那么此时比较临时哈希表中该字符串的个数b和目标哈希表该字符串的个数a.
- 若b<a,回到(1), 继续找。
- 若b>a,那么不断右移p(别忘了把移出去的字符串从bb中删除),直到b=a。
- 若b=a,这个时候需要比较(bb的大小len_temp)和(words的大小len)
- 若len_temp=len,说明我们找到了一个目标解,同时右移p(别忘了把移出去的字符串从bb中删除), 回到(1), 继续找。
- 若len_temp<len,说明有的目标字符串还没有找到, 回到(1), 继续找。
(2)如果q后面的字符串不在目标哈希表中,说明是无效字符串。同时右移p, q到下一个候选位置,重新开始找,清空bb。
class Solution {
public:
vector<int> findSubstring(string s, vector<string>& words) {
if (s.empty() || words.empty()) return{};
unordered_map<string, int> aa, bb;
vector<int>re;
for (auto x : words) aa[x]++;
int len = words.size(), l = 0, r = 0, c = words[0].size();
for(int i = 0; i < c; ++i){//我们只需要遍历前c个位置
l = i, r = i;
bb.clear();
while (r + c <= s.size()){
string ss = s.substr(r, c);
if (aa.count(ss)){
bb[ss]++;
r += c;
while (bb[ss]>aa[ss]) {
bb[s.substr(l, c)]--;
l += c;
}
if (bb[ss] == aa[ss] && r - l == len*c){
re.push_back(l);
bb[s.substr(l, c)]--;
l += c;
}
}
else{
bb.clear();
l =r+ c;
r = l;
}
}
}
return re;
}
};