LeetCode30-串联所有单词的子串
30. 串联所有单词的子串:
给定一个字符串 s 和一些 长度相同 的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符 ,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]
示例 3:
输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]
提示:
- 1 <= s.length <= 10^4
- s 由小写英文字母组成
- 1 <= words.length <= 5000
- 1 <= words[i].length <= 30
- words[i] 由小写英文字母组成
解题思路1:
哈希算法+双指针尺取
由于所有单词长度相同,尺取时可以利用hash算法判断每一个单词是否存在,由于单词可能不一定从第1个位置开始,所有要枚举一个单词长度来让每一个位置都有被取到的可能。
代码如下:
typedef long long ll;
typedef unsigned long long ull;
const int MAXN=1e4+5;
const ull base=997; //或者233317,大一点的素数
const ull mod=INT_MAX; //一般不超过INT_MAX,因为后面求子串mod值有Hash[l-1]*po[r-l+1],超过INT_MAX可能会超ull。注意:取1e9+7可能被出题人卡
class Solution {
ull po[MAXN];
ull Hash[MAXN];
map<ull,int>mp;
map<ull,int>vis;
void init(string s) {
po[0]=1;
po[1]=base;
for(int i=2;i<=10002;++i){
po[i]=(po[i-1]*base)%mod;
}
int len=s.size();
Hash[0]=s[0]-'a';
for(int i=1;i<len;++i){
Hash[i]=(Hash[i-1]*base%mod+(s[i]-'a'))%mod;
}
}
ull get_hash(int l,int r){
if(l==0)
return Hash[r];
ull ans=((Hash[r]+mod-Hash[l-1]*po[r-l+1]%mod)%mod+mod)%mod; //这里要先加mod,防止相减小于0,溢出
return ans;
}
ull hash_fun(string s){
int len=s.size();
ull ans=0;
for(int i=0;i<len;++i)
ans=(ans*base%mod+(s[i]-'a'))%mod;
return ans;
}
//将word的所有Hash值放入map中
void deal_word(vector<string>& words){
mp.clear();
int len=words.size();
for(int i=0;i<len;++i) {
ull tmp=hash_fun(words[i]);
++mp[tmp];
}
}
public:
vector<int> findSubstring(string s, vector<string>& words) {
init(s);
deal_word(words); //将word的所有Hash值放入map中
vector<int>ans;
int s_len=s.size();
int len=words[0].size();
int total=words.size();
for(int i=0;i<len;++i) { //枚举每一个位置
int l=i,r=l;
int cnt=0;
vis.clear();
while(r+len<=s_len){
r+=len;
ull val=get_hash(r-len,r-1);
if(mp[val]!=0) {
if(vis[val]<mp[val]){
++vis[val];
++cnt;
if(cnt==total)
ans.push_back(l);
}
else{ //已经满了
while(vis[val]>=mp[val]) {
l+=len;
ull sub=get_hash(l-len,l-1);
--vis[sub];
--cnt;
}
++vis[val];
++cnt;
if(cnt==total)
ans.push_back(l);
}
}
else{
vis.clear();
cnt=0;
l=r;
}
}
}
return ans;
}
};
解题思路2:
map标记+双指针尺取
在上面思路下,直接用map标记记录子串+尺取就行
代码如下:
class Solution {
map<string,int>mp;
map<string,int>vis;
void deal_word(vector<string>& words) {
int len=words.size();
for(int i=0;i<len;++i)
++mp[words[i]];
}
public:
vector<int> findSubstring(string s, vector<string>& words) {
deal_word(words); //将word的所有Hash值放入map中
vector<int>ans;
int s_len=s.size();
int len=words[0].size();
int total=words.size();
for(int i=0;i<len;++i) { //枚举每一个位置
int l=i,r=l;
int cnt=0;
vis.clear();
while(r+len<=s_len){
r+=len;
string val=s.substr(r-len,len);
//cout<<"string="<<val<<endl;
if(mp[val]!=0) {
if(vis[val]<mp[val]) {
++vis[val];
++cnt;
if(cnt==total)
ans.push_back(l);
}
else { //这个字符串已经够了
while(vis[val]>=mp[val]) {
string sub=s.substr(l,len);
--vis[sub];
--cnt;
l+=len;
}
++vis[val];
++cnt;
if(cnt==total)
ans.push_back(l);
}
}
else {
l=r;
vis.clear();
cnt=0;
}
}
}
return ans;
}
};