算法---滑动窗口练习-7(串联所有单词的子串)

本文介绍了如何通过滑动窗口和哈希表的算法原理,查找一个字符串中包含特定单词列表的所有子串,并提供了C++代码实现。

1. 题目解析

题目地址串联所有单词的子串

在这里插入图片描述

2. 讲解算法原理

在这里插入图片描述
在这里插入图片描述


算法的基本思想是使用滑动窗口来遍历字符串s,并利用两个哈希表(hash1和hash2)来统计窗口中子串的频次。

具体的算法步骤如下:

  1. 创建一个无序哈希表hash2,用于记录给定单词列表中各单词的频次。初始时,哈希表中所有单词的频次都为0。

  2. 遍历给定单词列表words,将列表中的单词映射到hash2中,并增加相应单词的频次。

  3. 创建一个空的结果集ret,用于存储找到的子串的起始位置。

  4. 获取单词列表中的单词长度len,字符串s的长度n,以及单词列表的长度m。

  5. 进入一个外层循环,循环变量i表示窗口的起始位置,范围从0到len-1。这是为了遍历所有可能的起始位置。

    • 在外层循环中,初始化一个空的哈希表hash1,用于统计窗口中子串的频次。

    • 进入一个内层循环,循环变量left表示窗口的左指针,初始时与外层循环变量i相等,循环变量right表示窗口的右指针,初始时也与外层循环变量i相等。循环条件为right+len小于等于字符串s的长度。

      • 在内层循环中,首先将窗口右侧的子串加入窗口,即将hash1中对应子串的频次加1。

      • 检查加入窗口的子串是否是有效子串,即其频次小于等于hash2中对应子串的频次。如果是有效子串,则将计数器count加1。

      • 检查窗口大小是否超过了单词列表的总长度,即right-left+1是否大于len*m。如果超过了窗口大小,则需要移动窗口。

      • 移动窗口的过程包括以下几个步骤:

      • 检查窗口左侧的子串是否是有效子串,即其频次小于等于hash2中对应子串的频次。如果是有效子串,则将计数器count减1。

      • 将窗口左侧的子串从窗口中移除,即将hash1中对应子串的频次减1。

      • 将左指针left向右移动len位。

      • 检查计数器count是否等于单词列表的长度m。如果相等,则表示当前窗口包含了给定单词列表中的所有单词,将左指针left的位置加入结果集ret。

    • 将右指针right向右移动len位,继续内层循环。

  6. 外层循环结束后,返回结果集ret,其中包含了所有包含给定单词列表中所有单词的子串的起始位置。


3. 编写代码

class Solution {
public:
    vector<int> findSubstring(string s, vector<string>& words) {
        unordered_map<string,int> hash2;
        for(auto &e :words)hash2[e]++;
        vector<int> ret;
        int len=words[0].size(),n=s.size(),m=words.size();
        for(int i=0;i<len;i++)
        {
            //维护窗口中有效字符串个数
            unordered_map<string,int> hash1;
            for (int left=i,right=i,count=0;right+len<=n;right+=len)
            {
                //进
                string in=s.substr(right,len);
                hash1[in]++;
                if(hash2.count(in) && hash1[in]<=hash2[in]) count++;
                
                //出
                if(right-left+1>len*m)
                {
                    string out=s.substr(left,len);
                    if(hash2.count(out) && hash1[out]<=hash2[out]) count--;

                    hash1[out]--;
                    left+=len;
                   
                }
                if(count==m) ret.push_back(left);
            }
        }
        return ret;
    }
};
### 使用滑动窗口算法解决串联所有单词子串 #### 解决方案概述 为了处理 LeetCode 第 30 题的要求,即在字符串 `s` 中寻找由字符串数组 `words` 组成的所有可能的连续子串的位置,采用滑动窗口方法是一种高效的选择[^1]。 #### 参数定义与初始化 设定了几个重要的参数来辅助解决问题: - 设 `m = words.length` 表示单词的数量; - 设 `len` 是 `words` 数组中单个单词的长度,则整个窗口宽度应设定为 `len * m`;这代表了当我们在字符串 `s` 上应用此窗口时所期望匹配到的一系列连续字符总长度[^2]。 #### 实现思路 通过内外两层嵌套的方式实现滑动窗口机制: 外层循环负责遍历起点位置的变化,每次前进步长设置为单一单词长度(`len`)。对于每一个新的起始点而言, 内层则利用固定大小等于全部目标短语拼接后的整体尺寸(`len*m`)作为扫描单位,在当前选定范围内逐一对比是否存在符合条件的结果集[^4]。 具体操作如下所示: ```python from collections import Counter, defaultdict def findSubstring(s: str, words: List[str]) -> List[int]: if not s or not words: return [] word_length = len(words[0]) total_words = len(words) window_size = word_length * total_words # 记录每个单词出现次数 word_count = Counter(words) result_indices = [] for i in range(word_length): start = i current_word_counts = defaultdict(int) matched_words = 0 for j in range(i, len(s) - word_length + 1, word_length): substring = s[j:j + word_length] if substring in word_count: current_word_counts[substring] += 1 while current_word_counts[substring] > word_count[substring]: temp_start_str = s[start:start + word_length] current_word_counts[temp_start_str] -= 1 if current_word_counts[temp_start_str] >= word_count[temp_start_str]: matched_words -= 1 start += word_length matched_words += 1 if matched_words == total_words: result_indices.append(start) else: start = j + word_length current_word_counts.clear() matched_words = 0 return result_indices ``` 该函数首先检查输入的有效性并计算必要的变量值。接着创建了一个外部for循环用于控制初始偏移量i (范围是从0至word_length),从而确保能够捕捉到任何潜在解法而不遗漏任何一个可能性。内部逻辑则是基于上述提到的方法论构建而成,旨在有效地定位满足条件的索引列表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

originalHSL.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值