题目要求

思路解析
-
计算每个单词的长度word_len,以及整个串联子串的长度window_len(即word_len * len(words))。
-
使用Counter统计words中每个单词的出现次数,作为目标字典target_cnt。
-
由于单词是定长的,我们可以按单词长度进行分组,从0到word_len-1作为起始位置,分别进行滑动窗口。这样避免遗漏以任意位置开始的子串。
-
对于每个起始位置start,我们维护一个滑动窗口,窗口的移动步长是word_len(每次移动一个单词)。窗口的左右边界都是按单词的边界来移动。
-
我们用一个字典cnt来记录当前窗口中每个单词出现的次数,用overload记录当前窗口中超出目标次数的单词种类数(注意:这里不是超出数量,而是种类。当某个单词在窗口中出现的次数等于目标次数时,我们就认为这个单词刚好,如果超过了,那么overload就会增加)。
代码演示
class Solution(object):
def findSubstring(self, s, words):
"""
:type s: str # 主字符串
:type words: List[str] # 单词列表(所有单词长度相同)
:rtype: List[int] # 返回所有符合条件的子串起始索引
"""
# 计算单个单词的长度(假设所有单词长度相同)
word_len = len(words[0])
# 计算目标子串的总长度(所有单词串联后的长度)
window_len = word_len * len(words)
# 使用Counter统计words中每个单词应出现的次数(目标频率)
target_cnt = Counter(words)
# 初始化结果列表
ans = []
# 按起始位置分组遍历(0 到 word_len-1)
for start in range(word_len):
# 初始化当前窗口的单词计数器
cnt = defaultdict(int)
# 记录当前窗口中"超量单词"的种类数(出现次数 > 目标次数的单词种类)
overload = 0
# 滑动窗口:right从start+word_len开始,以word_len为步长移动
# right表示当前窗口右边界(下一个单词的结束位置)
# 在 Python 的切片操作 s[left:right] 中,right 是不包含的,len(s)+1 确保 right 能取到 len(s)
for right in range(start + word_len, len(s)+1, word_len):
# 获取刚进入窗口的单词(左边界:right-word_len, 右边界:right)
in_word = s[right - word_len:right]
# 检查新加入单词是否会导致超额
if cnt[in_word] == target_cnt[in_word]:
overload += 1 # 该单词已达标,新增将导致超额
# 更新该单词的计数
cnt[in_word] += 1
# 计算当前窗口左边界
left = right - window_len
# 窗口未完全形成时跳过检查
if left < 0:
continue
# 检查当前窗口是否符合条件(无超额单词)
if overload == 0:
ans.append(left) # 记录有效起始位置
# 准备下一窗口:移出最左侧的单词
out_word = s[left: left + word_len]
# 更新移出单词的计数
cnt[out_word] -= 1
# 检查移出后该单词是否从"超额"变为"达标"
if cnt[out_word] == target_cnt[out_word]:
overload -= 1 # 减少超额单词种类计数
return ans
572

被折叠的 条评论
为什么被折叠?



