至多包含两个不同字符的最长子串-哈希表与双指针

双指针与哈希表求最长子串
本文介绍了一种使用双指针和哈希表的数据结构解决字符串问题的方法,具体为寻找包含至多两种不同字符的最长子串。通过移动两个指针并利用哈希表记录字符出现次数,算法能够高效地找到满足条件的最长子串。

题目描述:

给定一个字符串 s ,找出 至多 包含两个不同字符的最长子串 t 。

示例 1:
输入: “eceba”
输出: 3
解释: t 是 “ece”,长度为3。

示例 2:
输入: “ccaabbb”
输出: 5
解释: t 是 “aabbb”,长度为5

解题思路:

可以利用双指针(i,j)在字符串上进行移动,来判定满足要求的最长子串。那么指针如何计算长度,i怎么移动,j怎么移动呢?

  • 很显然,子串的长度就是i与j之间的距离

  • i就在for循环下,一直往前走

  • j显然要在(i,j)之间包含的字符种类数超过2个时进行移动,一直要使(i,j)之间包含的字符种类数为2,那如何统计二者之间的字符种类数呢?、

    • hash表显然是一个好的工具,统计(i,j)之间的字符种类数-------------->hash.size()
    • 当(i,j)不再包含某个字符,则需要在hash表中更新(删除它)------->hash.erase(key)

提交代码

class Solution {
public:
    int lengthOfLongestSubstringTwoDistinct(string s) {
        unordered_map<char, int> map;//定义哈希表
        int result=0;
        //i代表字符串的字符,j代表hash表的
       for(int i=0,j=0;i<s.size();i++)
       {
           map[s[i]]++;//统计扫描的字符,当前各自的个数
           while(map.size()>2)//若当前统计了2个字符
           {
               map[s[j]]--;//统计的字符中,最前面的下标,一个一个移动
               if(map[s[j]]==0)//若j号字符已经减为0,说明这个字符是现在统计的多余的那个
               {
                   map.erase(s[j]);
               }
               j++;
           }
           result=max(result,i-j+1);
       }
       return result;
    }
};

<think>嗯,用户想找Python实现包含K个不同字符长子算法。这个问题我之前在LeetCode上见过,好像是第159题和340题的变体。首先得回忆一下滑动窗口方法,这是处理子串问题的常用技巧。 首先,我需要确定算法的基本思路。滑动窗口通常用两个指针,left和right,来标记当前窗口的左右边界。然后,用一个哈希表或者字典来记录窗口内各个字符的出现次数。当窗口中的不同字符数超过K时,移动左指针缩小窗口,直到不同字符数回到K或以下。 那具体怎么实现呢?比如,如何统计不同字符的数量?可以用字典,键是字符,值是该字符在窗口中的出现次数。当某个字符的计数从0变为1时,不同字符数加1;当某个字符的计数减到0时,不同字符数减1。这样就能动态维护当前窗口中的字符种类数。 接下来,考虑窗口的扩展和收缩。右指针每次向右移动,将当前字符加入字典,并检查不同字符数是否超过K。如果超过,就需要移动左指针,直到满足条件为止。在这个过程中,记录窗口的最大长度。 可能的边界情况包括K为0的情况,这时候应该返回0。另外,字符串为空或者长度小于K的情况也需要处理。 然后,编写代码的时候要注意效率。比如,字典的更新和查询操作应该是O(1)时间,这样整个算法的时间复杂度是O(n),因为每个字符多被访问两次(左右指针各一次)。 用户可能需要具体的代码示例,所以需要写出一个函数,接受字符串s和整数k作为参数,返回长子的长度。还要考虑测试用例,比如示例中的输入是否正确处理。 另外,用户可能关心优化方法,比如如何减少不必要的计算,或者是否有更高效的数据结构。比如,可以用collections.defaultdict来简化字典的初始化,或者使用变量来跟踪当前不同字符的数量,而不是每次都遍历字典统计键的数量。 后,生成相关问题的时候,可以考虑滑动窗口的其他应用,比如无重复字符长子,或者包含所有字符子串。还有如何处理不同K值的情况,或者算法的时间复杂度分析等。</think>### Python实现至多包含K个不同字符长子算法 #### 算法思路 该问题属于滑动窗口类问题的经典变体,核心是通过维护一个可变窗口,动态调整左右边界以满足「多K个不同字符」的约束条件[^3][^5]。主要步骤包括: 1. 使用哈希表记录窗口内字符出现次数 2. 右指针持续扩展窗口 3. 当不同字符数超过K时,左指针收缩窗口 4. 始终记录最大窗口长度 #### Python实现代码 ```python def length_of_longest_substring_k_distinct(s: str, k: int) -> int: if k == 0 or len(s) == 0: return 0 char_count = {} left = 0 max_len = 0 distinct = 0 for right in range(len(s)): r_char = s[right] if char_count.get(r_char, 0) == 0: distinct += 1 char_count[r_char] = char_count.get(r_char, 0) + 1 while distinct > k: l_char = s[left] char_count[l_char] -= 1 if char_count[l_char] == 0: distinct -= 1 left += 1 max_len = max(max_len, right - left + 1) return max_len ``` #### 复杂度分析 - 时间复杂度:$O(n)$,每个字符多被访问两次(右指针扩展和左指针收缩) - 空间复杂度:$O(k)$,哈希表多存储$k+1$个字符的计数[^1][^5] #### 示例测试 ```python print(length_of_longest_substring_k_distinct("eceba", 2)) # 输出3("ece") print(length_of_longest_substring_k_distinct("aa", 1)) # 输出2 ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值