LeetCode30-串联所有单词的子串

该博客主要介绍了如何解决LeetCode上的第30题,即串联所有单词的子串问题。通过哈希算法和双指针尺取策略,实现查找给定字符串中由特定单词组成的子串起始位置。文章提供了两种解题思路,一种利用哈希表进行快速查找和更新,另一种使用map记录单词出现次数并进行双指针遍历。两种方法都确保了在满足题目要求的情况下,找到所有可能的子串起始位置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

LeetCode30-串联所有单词的子串

Leetcode / 力扣

30. 串联所有单词的子串:

给定一个字符串 s 和一些 长度相同 的单词 words 。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。

注意子串要与 words 中的单词完全匹配,中间不能有其他字符 ,但不需要考虑 words 中单词串联的顺序。
示例 1:

输入:s = "barfoothefoobarman", words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。

示例 2:

输入:s = "wordgoodgoodgoodbestword", words = ["word","good","best","word"]
输出:[]

示例 3:

输入:s = "barfoofoobarthefoobarman", words = ["bar","foo","the"]
输出:[6,9,12]

提示:

  • 1 <= s.length <= 10^4
  • s 由小写英文字母组成
  • 1 <= words.length <= 5000
  • 1 <= words[i].length <= 30
  • words[i] 由小写英文字母组成

解题思路1:

哈希算法+双指针尺取
由于所有单词长度相同,尺取时可以利用hash算法判断每一个单词是否存在,由于单词可能不一定从第1个位置开始,所有要枚举一个单词长度来让每一个位置都有被取到的可能。
代码如下:

typedef long long ll;
typedef unsigned long long ull;

const int MAXN=1e4+5;
const ull base=997; //或者233317,大一点的素数
const ull mod=INT_MAX;   //一般不超过INT_MAX,因为后面求子串mod值有Hash[l-1]*po[r-l+1],超过INT_MAX可能会超ull。注意:取1e9+7可能被出题人卡

class Solution {
    ull po[MAXN];
    ull Hash[MAXN];
    map<ull,int>mp;
    map<ull,int>vis;

    void init(string s) {
        po[0]=1;
        po[1]=base;
        for(int i=2;i<=10002;++i){
            po[i]=(po[i-1]*base)%mod;
        }

        int len=s.size();
        Hash[0]=s[0]-'a';
        for(int i=1;i<len;++i){
            Hash[i]=(Hash[i-1]*base%mod+(s[i]-'a'))%mod;
        }
    }

    ull get_hash(int l,int r){
        if(l==0)
            return Hash[r];
        ull ans=((Hash[r]+mod-Hash[l-1]*po[r-l+1]%mod)%mod+mod)%mod;    //这里要先加mod,防止相减小于0,溢出
        return ans;
    }

    ull hash_fun(string s){
        int len=s.size();
        ull ans=0;
        for(int i=0;i<len;++i)
            ans=(ans*base%mod+(s[i]-'a'))%mod;
        return ans;
    }

    //将word的所有Hash值放入map中
    void deal_word(vector<string>& words){
        mp.clear();
        int len=words.size();
        for(int i=0;i<len;++i) {
            ull tmp=hash_fun(words[i]);
            ++mp[tmp];
        }
    }

public:
    vector<int> findSubstring(string s, vector<string>& words) {
        init(s);
        deal_word(words);   //将word的所有Hash值放入map中
        vector<int>ans;
        int s_len=s.size();
        int len=words[0].size();
        int total=words.size();
        for(int i=0;i<len;++i) {    //枚举每一个位置
            int l=i,r=l;
            int cnt=0;
            vis.clear();
            while(r+len<=s_len){
                r+=len;
                ull val=get_hash(r-len,r-1);
                if(mp[val]!=0) {
                    if(vis[val]<mp[val]){
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                    else{   //已经满了
                        while(vis[val]>=mp[val]) {
                            l+=len;
                            ull sub=get_hash(l-len,l-1);
                            --vis[sub];
                            --cnt;
                        }
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                }
                else{
                    vis.clear();
                    cnt=0;
                    l=r;
                }
            }
        }
        return ans;
    }
};

解题思路2:

map标记+双指针尺取
在上面思路下,直接用map标记记录子串+尺取就行
代码如下:

class Solution {
    map<string,int>mp;
    map<string,int>vis;
    void deal_word(vector<string>& words) {
        int len=words.size();
        for(int i=0;i<len;++i)
            ++mp[words[i]];
    }

public:
    vector<int> findSubstring(string s, vector<string>& words) {
        deal_word(words);   //将word的所有Hash值放入map中
        vector<int>ans;
        int s_len=s.size();
        int len=words[0].size();
        int total=words.size();
        for(int i=0;i<len;++i) {    //枚举每一个位置
            int l=i,r=l;
            int cnt=0;
            vis.clear();
            while(r+len<=s_len){
                r+=len;
                string val=s.substr(r-len,len);
                //cout<<"string="<<val<<endl;
                if(mp[val]!=0) {
                    if(vis[val]<mp[val]) {
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                    else {  //这个字符串已经够了
                        while(vis[val]>=mp[val]) {
                            string sub=s.substr(l,len);
                            --vis[sub];
                            --cnt;
                            l+=len;
                        }
                        ++vis[val];
                        ++cnt;
                        if(cnt==total)
                            ans.push_back(l);
                    }
                }
                else {
                    l=r;
                    vis.clear();
                    cnt=0;
                }
            }
        }
        return ans;
    }
};
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值