滑动窗口—至多包含 K 个不同字符的最长子串(leetcode 340)

本文解析了一种利用滑动窗口和哈希表解决字符串s中最多包含k个不同字符的最长子串T的算法。通过实例和代码展示了如何在O(N)到O(Nk)的时间复杂度范围内找到解决方案,并讨论了其适用场景和空间复杂度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

给定一个字符串 s ,找出 至多 包含 k 个不同字符的最长子串 T。

示例 1:

输入: s = "eceba", k = 2
输出: 3
解释: 则 T 为 "ece",所以长度为 3。

示例 2:

输入: s = "aa", k = 1
输出: 2
解释: 则 T 为 "aa",所以长度为 2。

算法分析

我们使用滑动窗口方法,使用两个指针 left 和 right 标记窗口的边界。

思路是将左右指针都设置为 0,然后向右移动 right 指针保证区间内含有不超过 k 个不同字符。当移动到含有 k + 1 个不同字符的时候,移动 left 指针直到区间内不含有超过 k + 1 个不同字符。

这个算法的基本思想是:在字符串上移动滑动窗口,保证窗口内有不超过 k 个不同字符,同时在每一步更新最大子串长度。

    只有一个问题需要解决:如何移动左指针保证子串中只包含 k 个不同字符?

我们可以使用一个哈希表,建立从字符到滑动窗口最右出现位置的映射,在任意时刻,哈希表不能包含 k+1 个元素。

例如,使用哈希表可以知道字符 O 在 "LOVELEE" 窗口最右出现位置为 1,所以只需要将 left 指针移动到位置 1 + 1 = 2 保证将字符 O 排除在滑动窗口外。

代码

class Solution {
public:
    int lengthOfLongestSubstringKDistinct(string s, int k) {
        int n = s.length();
        if(n < k) {
            return n;
        }
        unordered_map<char, int> windows;
        int left = 0, max_str = 0, kind = 0;
        for(int right = 0; right < n; ++ right) {
            if(windows[s[right]] == 0) {
                ++kind;
            }
            ++windows[s[right]];
            while(kind > k) {
                --windows[s[left]];
                if(windows[s[left]] == 0) {
                    --kind;
                }
                ++left;
            }
            max_str = std::max(max_str, right - left + 1);
        }
        return max_str;
    }
};

时间复杂度分析

对于最好情况,如果字符串不超过 k 个不同字符,答案是肯定的。因为只需要一次遍历就可以得到结果,时间复杂度是 O(N)。

对于最坏情况,当输入字符串包含 n 个不同字符,答案是不能。因为每一步都需要花费 O(k)时间找到哈希表中的最小值,所以总的复杂度是 O(Nk)。

    时间复杂度:最好情况下是 O(N),最坏情况下是 O(Nk)。
    空间复杂度:哈希表的空间开销:O(k)。

<think>嗯,用户想找Python实现包含K个不同字符长子算法。这个问题我之前在LeetCode上见过,好像是第159题和340题的变体。首先得回忆一下滑动窗口方法,这是处理子问题的常用技巧。 首先,我需要确定算法的基本思路。滑动窗口通常用两个指针,left和right,来标记当前窗口的左右边界。然后,用一个哈希表或者字典来记录窗口内各个字符的出现次数。当窗口中的不同字符数超过K时,移动左指针缩小窗口,直到不同字符数回到K或以下。 那具体怎么实现呢?比如,如何统计不同字符的数量?可以用字典,键是字符,值是该字符在窗口中的出现次数。当某个字符的计数从0变为1时,不同字符数加1;当某个字符的计数减到0时,不同字符数减1。这样就能动态维护当前窗口中的字符种类数。 接下来,考虑窗口的扩展和收缩。右指针每次向右移动,将当前字符加入字典,并检查不同字符数是否超过K。如果超过,就需要移动左指针,直到满足条件为止。在这个过程中,记录窗口的大长度。 可能的边界情况包括K为0的情况,这时候应该返回0。另外,字符为空或者长度小于K的情况也需要处理。 然后,编写代码的时候要注意效率。比如,字典的更新和查询操作应该是O(1)时间,这样整个算法的时间复杂度是O(n),因为每个字符多被访问两次(左右指针各一次)。 用户可能需要具体的代码示例,所以需要写出一个函数,接受字符s和整数k作为参数,返回长子的长度。还要考虑测试用例,比如示例中的输入是否正确处理。 另外,用户可能关心优化方法,比如如何减少不必要的计算,或者是否有更高效的数据结构。比如,可以用collections.defaultdict来简化字典的初始化,或者使用变量来跟踪当前不同字符的数量,而不是每次都遍历字典统计键的数量。 后,生成相关问题的时候,可以考虑滑动窗口的其他应用,比如无重复字符长子,或者包含所有字符短子。还有如何处理不同K值的情况,或者算法的时间复杂度分析等。</think>### Python实现至多包含K个不同字符长子算法 #### 算法思路 该问题属于滑动窗口类问题的经典变体,核心是通过维护一个可变窗口,动态调整左右边界以满足「多K个不同字符」的约束条件[^3][^5]。主要步骤包括: 1. 使用哈希表记录窗口内字符出现次数 2. 右指针持续扩展窗口 3. 当不同字符数超过K时,左指针收缩窗口 4. 始终记录大窗口长度 #### Python实现代码 ```python def length_of_longest_substring_k_distinct(s: str, k: int) -> int: if k == 0 or len(s) == 0: return 0 char_count = {} left = 0 max_len = 0 distinct = 0 for right in range(len(s)): r_char = s[right] if char_count.get(r_char, 0) == 0: distinct += 1 char_count[r_char] = char_count.get(r_char, 0) + 1 while distinct > k: l_char = s[left] char_count[l_char] -= 1 if char_count[l_char] == 0: distinct -= 1 left += 1 max_len = max(max_len, right - left + 1) return max_len ``` #### 复杂度分析 - 时间复杂度:$O(n)$,每个字符多被访问两次(右指针扩展和左指针收缩) - 空间复杂度:$O(k)$,哈希表多存储$k+1$个字符的计数[^1][^5] #### 示例测试 ```python print(length_of_longest_substring_k_distinct("eceba", 2)) # 输出3("ece") print(length_of_longest_substring_k_distinct("aa", 1)) # 输出2 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值