LeetCode 30. 串联所有单词的子串

原创已于 2025-06-11 22:37:31 修改 · 345 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#python #数据结构 #算法 #leetcode

于 2025-06-11 22:36:09 首次发布

LeetCode 30. 串联所有单词的子串

题目要求
思路解析
代码演示

题目要求

在这里插入图片描述

思路解析

计算每个单词的长度word_len，以及整个串联子串的长度window_len（即word_len * len(words)）。
使用Counter统计words中每个单词的出现次数，作为目标字典target_cnt。
由于单词是定长的，我们可以按单词长度进行分组，从0到word_len-1作为起始位置，分别进行滑动窗口。这样避免遗漏以任意位置开始的子串。
对于每个起始位置start，我们维护一个滑动窗口，窗口的移动步长是word_len（每次移动一个单词）。窗口的左右边界都是按单词的边界来移动。
我们用一个字典cnt来记录当前窗口中每个单词出现的次数，用overload记录当前窗口中超出目标次数的单词种类数（注意：这里不是超出数量，而是种类。当某个单词在窗口中出现的次数等于目标次数时，我们就认为这个单词刚好，如果超过了，那么overload就会增加）。

代码演示

class Solution(object):
    def findSubstring(self, s, words):
        """
        :type s: str         # 主字符串
        :type words: List[str]  # 单词列表（所有单词长度相同）
        :rtype: List[int]    # 返回所有符合条件的子串起始索引
        """
        # 计算单个单词的长度（假设所有单词长度相同）
        word_len = len(words[0])
        # 计算目标子串的总长度（所有单词串联后的长度）
        window_len = word_len * len(words)

        # 使用Counter统计words中每个单词应出现的次数（目标频率）
        target_cnt = Counter(words)

        # 初始化结果列表
        ans = []
        
        # 按起始位置分组遍历（0 到 word_len-1）
        for start in range(word_len):
            # 初始化当前窗口的单词计数器
            cnt = defaultdict(int)
            # 记录当前窗口中"超量单词"的种类数（出现次数 > 目标次数的单词种类）
            overload = 0
            
            # 滑动窗口：right从start+word_len开始，以word_len为步长移动
            # right表示当前窗口右边界（下一个单词的结束位置）
            # 在 Python 的切片操作 s[left:right] 中，right 是不包含的，len(s)+1 确保 right 能取到 len(s)
            for right in range(start + word_len, len(s)+1, word_len):
                # 获取刚进入窗口的单词（左边界：right-word_len, 右边界：right）
                in_word = s[right - word_len:right]
                
                # 检查新加入单词是否会导致超额
                if cnt[in_word] == target_cnt[in_word]:
                    overload += 1  # 该单词已达标，新增将导致超额
                # 更新该单词的计数
                cnt[in_word] += 1
                
                # 计算当前窗口左边界
                left = right - window_len
                # 窗口未完全形成时跳过检查
                if left < 0:
                    continue
                
                # 检查当前窗口是否符合条件（无超额单词）
                if overload == 0:
                    ans.append(left)  # 记录有效起始位置
                
                # 准备下一窗口：移出最左侧的单词
                out_word = s[left: left + word_len]
                # 更新移出单词的计数
                cnt[out_word] -= 1
                # 检查移出后该单词是否从"超额"变为"达标"
                if cnt[out_word] == target_cnt[out_word]:
                    overload -= 1  # 减少超额单词种类计数
        
        return ans