LeetCode30-串联所有单词的子串

最新推荐文章于 2024-05-21 15:15:55 发布

原创最新推荐文章于 2024-05-21 15:15:55 发布 · 292 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#leetcode #哈希算法 #算法

LeetCode题解专栏收录该内容

51 篇文章

订阅专栏

该博客主要介绍了如何解决LeetCode上的第30题，即串联所有单词的子串问题。通过哈希算法和双指针尺取策略，实现查找给定字符串中由特定单词组成的子串起始位置。文章提供了两种解题思路，一种利用哈希表进行快速查找和更新，另一种使用map记录单词出现次数并进行双指针遍历。两种方法都确保了在满足题目要求的情况下，找到所有可能的子串起始位置。

LeetCode30-串联所有单词的子串

Leetcode / 力扣

30. 串联所有单词的子串：

给定一个字符串 s 和一些 长度相同 的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配，中间不能有其他字符 ，但不需要考虑 words 中单词串联的顺序。
示例 1：

输入：s = "barfoothefoobarman", words = ["foo","bar"]
输出：[0,9]
解释：
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。

示例 2：

输入：s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出：[]

示例 3：

输入：s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出：[6,9,12]

提示：

1 <= s.length <= 10^4
s 由小写英文字母组成
1 <= words.length <= 5000
1 <= words[i].length <= 30
words[i] 由小写英文字母组成

解题思路1：

哈希算法+双指针尺取
由于所有单词长度相同，尺取时可以利用hash算法判断每一个单词是否存在，由于单词可能不一定从第1个位置开始，所有要枚举一个单词长度来让每一个位置都有被取到的可能。
代码如下：

typedef long long ll;
typedef unsigned long long ull;

const int MAXN=1e4+5;
const ull base=997; //或者233317,大一点的素数
const ull mod=INT_MAX;   //一般不超过INT_MAX,因为后面求子串mod值有Hash[l-1]*po[r-l+1],超过INT_MAX可能会超ull。注意：取1e9+7可能被出题人卡

class Solution {
    ull po[MAXN];
    ull Hash[MAXN];
    map<ull,int>mp;
    map<ull,int>vis;

    void init(string s) {
        po[0]=1;
        po[1]=base;
        for(int i=2;i<=10002;++i){
            po[i]=(po[i-1]*base)%mod;
        }

        int len=s.size();
        Hash[0]=s[0]-'a';
        for(int i=1;i<len;++i){
            Hash[i]=(Hash[i-1]*base%mod+(s[i]-'a'))%mod;
        }
    }

    ull get_hash(int l,int r){
        if(l==0)
            return Hash[r];
        ull ans=((Hash[r]+mod-Hash[l-1]*po[r-l+1]%mod)%mod+mod)%mod;    //这里要先加mod，防止相减小于0,溢出
        return ans;
    }

    ull hash_fun(string s){
        int len=s.size();
        ull ans=0;
        for(int i=0;i<len;++i)
            ans=(ans*base%mod+(s[i]-'a'))%mod;
        return ans;
    }

    //将word的所有Hash值放入map中
    void deal_word(vector<string>& words){
        mp.clear();
        int len=words.size();
        for(int i=0;i<len;++i) {
            ull tmp=hash_fun(words[i]);
            ++mp[tmp];
        }
    }

public:
    vector<int> findSubstring(string s, vector<string>& words) {
        init(s);
        deal_word(words);   //将word的所有Hash值放入map中
        vector<int>ans;
        int s_len=s.size();
        int len=words[0].size();
        int total=words.size();
        for(int i=0;i<len;++i) {    //枚举每一个位置
            int l=i,r=l;
            int cnt=0;
            vis.clear();
            while(r+len<=s_len){
                r+=len;
                ull val=get_hash(r-len,r-1);
                if(mp[val]!=0) {
                    if(vis[val]<mp[val]){
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                    else{   //已经满了
                        while(vis[val]>=mp[val]) {
                            l+=len;
                            ull sub=get_hash(l-len,l-1);
                            --vis[sub];
                            --cnt;
                        }
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                }
                else{
                    vis.clear();
                    cnt=0;
                    l=r;
                }
            }
        }
        return ans;
    }
};

解题思路2：

map标记+双指针尺取
在上面思路下，直接用map标记记录子串+尺取就行
代码如下:

class Solution {
    map<string,int>mp;
    map<string,int>vis;
    void deal_word(vector<string>& words) {
        int len=words.size();
        for(int i=0;i<len;++i)
            ++mp[words[i]];
    }

public:
    vector<int> findSubstring(string s, vector<string>& words) {
        deal_word(words);   //将word的所有Hash值放入map中
        vector<int>ans;
        int s_len=s.size();
        int len=words[0].size();
        int total=words.size();
        for(int i=0;i<len;++i) {    //枚举每一个位置
            int l=i,r=l;
            int cnt=0;
            vis.clear();
            while(r+len<=s_len){
                r+=len;
                string val=s.substr(r-len,len);
                //cout<<"string="<<val<<endl;
                if(mp[val]!=0) {
                    if(vis[val]<mp[val]) {
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                    else {  //这个字符串已经够了
                        while(vis[val]>=mp[val]) {
                            string sub=s.substr(l,len);
                            --vis[sub];
                            --cnt;
                            l+=len;
                        }
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                }
                else {
                    l=r;
                    vis.clear();
                    cnt=0;
                }
            }
        }
        return ans;
    }
};