包含K个不同字符的最长子串-滑动窗口法-Python2.7

使用滑动窗口法解决给定字符串中包含k个不同字符的最长子串问题。当k大于字符串中所有不同字符的个数时,返回整个字符串。Python2.7实现。
  • 题目描述:
    给定一个字符串和一个正数k,寻找一个包含k个不同字符的最长子串。如果k大于字符串中所有不同字符的个数,就返回整个字符串。
  • 输入描述:
    正数k
    字符串s
  • 输出描述:
    字符串

  • 样例输入:
    k = 2, s = ‘abcbdbdbbdcdabd’
    k = 3, s = ‘abcbdbdbbdcdabd’
    k = 5, s = ‘abcbdbdbbdcdabd’

  • 样例输出:
    k = 2 时,输出 ‘bdbdbbd’
    k = 3 时,输出 ‘bcbdbdbbdcd’
    k = 5 时,输出 ‘abcbdbdbbdcdabd’
  • 思路:
    滑动窗口法。
    滑动窗口法描述:滑动窗口法用一个窗口去满足问题的约束条件。一旦违反约束条件,窗口就会变得不稳定,为了消除这种不稳定,重新满足约束条件,我们需要通过增加或减小窗口的大小。
    在这个问题中,遍历字符串,如果窗口中不同字符个数小于k,则将字符加入到窗口中。如果不同字符的个数大于k,则从最左边的字符开始删除,直到窗口中不同字符的个数等于k。我们反复进行这种改变窗口大小的操作,直到遍历完整个字符串。在这个过程中,如果窗口大小改变,我们就更新最大窗口值。
    Python2.7实现
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Ti
<think>嗯,用户想找Python实现最多包含K个不同字符最长子串算法。这个问题我之前在LeetCode上见过,好像是第159题340题的变体。首先得回忆一下滑动窗口方法,这是处理子串问题的常用技巧。 首先,我需要确定算法的基本思路。滑动窗口通常用两个指针,leftright,来标记当前窗口的左右边界。然后,用一个哈希表或者字典来记录窗口内各个字符的出现次数。当窗口中的不同字符数超过K时,移动左指针缩小窗口,直到不同字符数回到K或以下。 那具体怎么实现呢?比如,如何统计不同字符的数量?可以用字典,键是字符,值是该字符在窗口中的出现次数。当某个字符的计数从0变为1时,不同字符数加1;当某个字符的计数减到0时,不同字符数减1。这样就能动态维护当前窗口中的字符种类数。 接下来,考虑窗口的扩展收缩。右指针每次向右移动,将当前字符加入字典,并检查不同字符数是否超过K。如果超过,就需要移动左指针,直到满足条件为止。在这个过程中,记录窗口的大长度。 可能的边界情况包括K为0的情况,这时候应该返回0。另外,字符串为空或者长度小于K的情况也需要处理。 然后,编写代码的时候要注意效率。比如,字典的更新查询操作应该是O(1)时间,这样整个算法的时间复杂度是O(n),因为每个字符最多被访问两次(左右指针各一次)。 用户可能需要具体的代码示例,所以需要写出一个函数,接受字符串s整数k作为参数,返回最长子串的长度。还要考虑测试用例,比如示例中的输入是否正确处理。 另外,用户可能关心优化方法,比如如何减少不必要的计算,或者是否有更高效的数据结构。比如,可以用collections.defaultdict来简化字典的初始化,或者使用变量来跟踪当前不同字符的数量,而不是每次都遍历字典统计键的数量。 后,生成相关问题的时候,可以考虑滑动窗口的其他应用,比如无重复字符最长子串,或者包含所有字符子串。还有如何处理不同K值的情况,或者算法的时间复杂度分析等。</think>### Python实现至多包含K个不同字符最长子串算法 #### 算法思路 该问题属于滑动窗口类问题的经典变体,核心是通过维护一个可变窗口,动态调整左右边界以满足「最多K个不同字符」的约束条件[^3][^5]。主要步骤包括: 1. 使用哈希表记录窗口内字符出现次数 2. 右指针持续扩展窗口 3.不同字符数超过K时,左指针收缩窗口 4. 始终记录大窗口长度 #### Python实现代码 ```python def length_of_longest_substring_k_distinct(s: str, k: int) -> int: if k == 0 or len(s) == 0: return 0 char_count = {} left = 0 max_len = 0 distinct = 0 for right in range(len(s)): r_char = s[right] if char_count.get(r_char, 0) == 0: distinct += 1 char_count[r_char] = char_count.get(r_char, 0) + 1 while distinct > k: l_char = s[left] char_count[l_char] -= 1 if char_count[l_char] == 0: distinct -= 1 left += 1 max_len = max(max_len, right - left + 1) return max_len ``` #### 复杂度分析 - 时间复杂度:$O(n)$,每个字符最多被访问两次(右指针扩展左指针收缩) - 空间复杂度:$O(k)$,哈希表最多存储$k+1$个字符的计数[^1][^5] #### 示例测试 ```python print(length_of_longest_substring_k_distinct("eceba", 2)) # 输出3("ece") print(length_of_longest_substring_k_distinct("aa", 1)) # 输出2 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值