【每日练题-leecode76. 最小覆盖子串】

76. 最小覆盖子串

困难

给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 "" 。

注意:

  • 对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。
  • 如果 s 中存在这样的子串,我们保证它是唯一的答案。

示例 1:

输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。

示例 2:

输入:s = "a", t = "a"
输出:"a"
解释:整个字符串 s 是最小覆盖子串。

示例 3:

输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。

提示:

  • m == s.length
  • n == t.length
  • 1 <= m, n <= 105
  • s 和 t 由英文字母组成

进阶:你能设计一个在 o(m+n) 时间内解决此问题的算法吗?

思路:

这个问题是一个经典的滑动窗口问题,我们可以通过使用双指针(左右指针)的方法来解决。滑动窗口算法的基本思想是,通过移动窗口的边界,来找到满足条件的最小子串。

以下是解决这个问题的步骤:

  1. 首先,统计字符串t中每个字符出现的次数,存储在一个哈希表中。

  2. 初始化两个指针leftright,分别表示子串的左右边界,以及两个变量countmin_length,用来记录当前窗口内满足条件的字符数量和当前找到的最小子串的长度。

  3. 遍历字符串s,将right指针向右移动,直到窗口内包含了t中所有字符的至少一个实例。

  4. 每次移动right指针时,检查当前窗口内是否包含了t中的所有字符。如果是,尝试通过移动left指针来缩小窗口的大小,直到窗口不再满足条件。

  5. 在每一步,如果找到了一个更小的满足条件的子串,就更新min_length

  6. 如果在整个s中都没有找到满足条件的子串,返回空字符串""

下面是这个问题的Python代码实现:

def min_window(s, t):
    from collections import Counter
    
    # 统计t中每个字符的出现次数
    counter_t = Counter(t)
    
    # 初始化左右指针和结果
    left, right, min_left, min_len = 0, 0, 0, float('inf')
    count = len(counter_t)
    
    # 用于存储当前窗口内字符的计数
    counter_window = {}
    
    while right < len(s):
        # 将right指针的字符加入窗口计数
        counter_window[s[right]] = counter_window.get(s[right], 0) + 1
        
        # 如果窗口中的字符在t中,且窗口中的计数满足t中该字符的最小出现次数
        if s[right] in counter_t and counter_window[s[right]] == counter_t[s[right]]:
            count -= 1
        
        # 当窗口满足条件时,尝试缩小窗口
        while count == 0:
            if right - left + 1 < min_len:
                min_len = right - left + 1
                min_left = left
            
            # 移除left指针的字符
            counter_window[s[left]] -= 1
            if s[left] in counter_t and counter_window[s[left]] < counter_t[s[left]]:
                count += 1
            
            left += 1
        
        right += 1
    
    # 如果没有找到满足条件的子串,返回空字符串
    return "" if min_len == float('inf') else s[min_left:min_left + min_len]

# 示例
print(min_window("ADOBECODEBANC", "ABC"))  # 输出 "BANC"
print(min_window("a", "a"))                # 输出 "a"
print(min_window("a", "aa"))               # 输出 ""

这个算法的时间复杂度是O(m+n),其中m是字符串s的长度,n是字符串t的长度。这是因为我们只需要遍历一次字符串s,并且在每次迭代中,我们只进行常数时间的操作。空间复杂度是O(min(m, n)),因为我们需要存储st中不同字符的计数,最坏情况下,这将是st中不同字符的数量。

下面是对代码的详细解释:

  1. 导入Counter类

    • from collections import Counter 这行代码导入了Python标准库中的Counter类,它是一个字典的子类,用于计数可哈希对象。
  2. 函数定义

    • def min_window(s, t): 定义了一个名为min_window的函数,接收两个字符串参数st
  3. 统计t中字符的出现次数

    • counter_t = Counter(t) 使用Counter类统计字符串t中每个字符的出现次数。
  4. 初始化变量

    • left, right, min_left, min_len 分别初始化为0和无穷大,这些变量用于记录滑动窗口的左右边界、最小子串的起始索引和长度。
    • count 初始化为len(counter_t),即t中不同字符的数量。
  5. 滑动窗口计数

    • counter_window 初始化为一个空字典,用于存储当前窗口内字符的计数。
  6. 遍历字符串s

    • 使用while right < len(s):循环遍历字符串s直到right指针到达字符串末尾。
  7. 更新窗口计数

    • 在循环内部,首先更新counter_window,将right指针的字符加入到当前窗口的计数中。
  8. 检查窗口是否满足条件

    • 如果当前字符在t中,并且当前窗口中该字符的计数等于t中该字符的计数,count减1。
  9. 尝试缩小窗口

    • 当窗口满足条件(即count为0)时,尝试通过移动left指针来缩小窗口,直到窗口不再满足条件。
  10. 更新最小子串

    • 如果当前窗口的长度小于之前记录的最小长度min_len,则更新min_lenmin_left
  11. 移动right指针

    • right += 1 移动right指针到下一个字符。
  12. 检查最小子串

    • 在循环结束后,如果min_len仍然是初始值(无穷大),说明没有找到满足条件的子串,返回空字符串""
    • 否则,根据min_leftmin_len返回最小覆盖子串。

这段代码使用了滑动窗口的方法来找到满足条件的最小子串。通过不断调整窗口的大小,直到窗口包含了t中的所有字符,然后尝试缩小窗口以找到更小的满足条件的子串。这种方法的时间复杂度是O(m+n),其中m是字符串s的长度,n是字符串t的长度,因为每个字符最多被访问两次(一次由right指针,一次可能由left指针)。空间复杂度是O(min(m, n)),因为counter_tcounter_window最多存储st中不同字符的数量。

时间复杂度

  1. 初始化阶段counter_t 的初始化需要遍历字符串 t,时间复杂度为 O(n)。
  2. 主循环right 指针的循环会遍历整个字符串 s,时间复杂度为 O(m)。对于每个 right 指针的位置,left 指针可能会移动,但每次移动 left 指针都是在尝试缩小窗口,且每个字符在 left 指针处最多被检查一次,因此这部分的时间复杂度仍然是 O(m)。
  3. 窗口内操作:窗口内的字符计数和比较操作是常数时间的。

综合考虑,时间复杂度主要由主循环决定,为 O(m + n),其中 m 是字符串 s 的长度,n 是字符串 t 的长度。

空间复杂度

  1. Counter 对象counter_t 存储了 t 中所有字符的计数,其空间复杂度为 O(k),k 是 t 中不同字符的数量,k <= n。
  2. 滑动窗口计数counter_window 存储了当前窗口内字符的计数,最坏情况下,如果 s 中包含 t 中所有字符,那么 counter_window 的大小将接近 min(m, k)
  3. 其他变量leftrightmin_leftmin_lencount 等变量占用的内存空间相对于 m 和 n 来说是常数级别的。

综合考虑,空间复杂度主要由 counter_tcounter_window 的大小决定,为 O(k + min(m, k))。在最坏的情况下,如果 st 包含相同的字符集,那么 k 接近 m,空间复杂度为 O(m)。如果 t 中的字符集合远小于 s,那么空间复杂度将接近 O(n)。

总结

  • 时间复杂度:O(m + n)
  • 空间复杂度:O(k + min(m, k)),其中 k 是 t 中不同字符的数量,且 k <= n。在最坏情况下,空间复杂度为 O(m)。

请注意,这里的分析假设字符集的大小(k)相对于 m 和 n 是较小的,这在实际应用中通常是成立的,因为字符集的大小通常是一个常数。如果字符集非常大,那么空间复杂度可能会接近 O(m) 或 O(n)。

### Java 实现最小覆盖子串算法 对于最小覆盖子串,在字符串 `s` 中找到能覆盖字符串 `t` 所有字符的最小子串是一项挑战。下面展示了一个基于滑动窗口技术来解决问的方法[^1]。 ```java import java.util.*; public class MinWindowSubstring { public String minWindow(String s, String t) { if (s == null || t == null || s.isEmpty() || t.isEmpty()) return ""; Map<Character, Integer> targetCount = new HashMap<>(); for (char c : t.toCharArray()) { targetCount.put(c, targetCount.getOrDefault(c, 0) + 1); } int requiredChars = targetCount.size(); int formed = 0; Map<Character, Integer> windowCounts = new HashMap<>(); int left = 0, right = 0; int[] ans = {-1, 0, 0}; while (right < s.length()) { char character = s.charAt(right); windowCounts.put(character, windowCounts.getOrDefault(character, 0) + 1); if (targetCount.containsKey(character) && windowCounts.get(character).intValue() == targetCount.get(character).intValue()) { formed++; } while (left <= right && formed == requiredChars) { character = s.charAt(left); if (ans[0] == -1 || right - left + 1 < ans[0]) { ans[0] = right - left + 1; ans[1] = left; ans[2] = right; } windowCounts.put(character, windowCounts.get(character) - 1); if (targetCount.containsKey(character) && windowCounts.get(character).intValue() < targetCount.get(character).intValue()) { formed--; } left++; } right++; } return ans[0] == -1 ? "" : s.substring(ans[1], ans[2] + 1); } } ``` 上述代码实现了滑动窗口方法,通过两个指针(`left`, `right`)维护当前考察的窗口范围,并利用哈希表记录目标字符串`t`中的字符频率以及当前窗口内的字符频率。当窗口内包含了足够的`t`中字符时尝试收缩左边界以优化解的空间大小[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值