Longest Substring with At Least K Repeating Characters

本文介绍了一种寻找字符串中每个字符至少重复k次的最长子串的算法。通过扫描并使用分隔符来划分原问题为子问题进行递归求解,提供了完整的Java实现代码。

Find the length of the longest substring T of a given string (consists of lowercase letters only) such that every character in T appears no less than k times.

Example 1:

Input:
s = "aaabb", k = 3

Output:
3

The longest substring is "aaa", as 'a' is repeated 3 times.

Example 2:

Input:
s = "ababbc", k = 2

Output:
5

The longest substring is "ababb", as 'a' is repeated 2 times and 'b' is repeated 3 times.

这个题蛮力法肯定不行,思路是扫描出现次数小于k的字母,然后将它们作为分隔符,然后就将这些子串划分成原问题的子问题,递归求解。


public class Solution {
    public int longestSubstring(String s, int k) {
        if(k<=1){
            return s.length();
        }
        
        int[] repeat=new int[26];
        for(int i=0;i<s.length();i++){
            repeat[s.charAt(i)-'a']++;
        }
        StringBuilder reg=new StringBuilder("");
        boolean firstSplit=true;
        for(int i=0;i<26;i++){
            if(repeat[i]>0&&repeat[i]<k){
                if(firstSplit){
                    reg.append((char)(i+'a'));
                    firstSplit=false;
                }
                else{
                    reg.append("|"+(char)(i+'a'));
                }
            }
        }
        if(reg.length()>0){
            //说明有分隔符
            String[] strs=s.split(reg.toString());
            int max=0;
            int tmpAns=0;
            for(String str:strs){
                tmpAns=longestSubstring(str, k);
                if(tmpAns>max){
                    max=tmpAns;
                }
            }
            return max;
        }
        else{
            //没有分隔符,说明s中的每一个字符出现的次数都大于等于k
            return s.length();
        }
    }
}



#include <iostream> #include <vector> #include <algorithm> #include <string> // 使用 constexpr 常量替代宏定义 constexpr long long HASH_BASE = 31; constexpr long long HASH_MOD = 1000000007; // 计算字符串的哈希值 long long hash(const std::string& s) { long long h = 0; for (char c : s) { h = ((h * HASH_BASE) % HASH_MOD + c) % HASH_MOD; } return h; } // 查找是否存在长度为 len 的重复子串 bool hasRepeatedSubstring(const std::string& s, int len) { if (len > s.length()) return false; std::vector<long long> hashes; long long basePower = 1; for (int i = 0; i < len; ++i) { basePower = (basePower * HASH_BASE) % HASH_MOD; } long long h = 0; for (int i = 0; i < s.length(); ++i) { h = ((h * HASH_BASE) % HASH_MOD + s[i]) % HASH_MOD; if (i >= len) { h = (h - (s[i - len] * basePower) % HASH_MOD + HASH_MOD) % HASH_MOD; } if (i >= len - 1) { hashes.push_back(h); } } std::sort(hashes.begin(), hashes.end()); for (int i = 1; i < hashes.size(); ++i) { if (hashes[i] == hashes[i - 1]) { return true; } } return false; } // 二分查找最长重复子串的长度 int longestRepeatedSubstring(const std::string& s) { int left = 1, right = static_cast<int>(s.length()) - 1; int result = 0; while (left <= right) { int mid = left + (right - left) / 2; if (hasRepeatedSubstring(s, mid)) { result = mid; left = mid + 1; } else { right = mid - 1; } } return result; } int main() { std::string s = "abcabcbb"; int len = longestRepeatedSubstring(s); std::cout << "The length of the longest repeated substring is: " << len << std::endl; return 0; } 未能正确输出,修改代码
最新发布
10-22
在原代码中,整体思路是正确的,使用了字符串哈希和二分查找的方法来寻找最长重复子串的长度。不过,原代码在计算哈希值时,对于子串哈希的更新部分存在一个小问题。在更新 `h` 时,当 `i >= len` ,减去 `(s[i - len] * basePower) % HASH_MOD` 这一步可能会导致 `h` 变为负数,因为取模运算的结果可能会小于 `(s[i - len] * basePower) % HASH_MOD` 。所以需要在减去之后再加上 `HASH_MOD` ,并再次取模,确保 `h` 为非负数。 以下是修改后的代码: ```cpp #include <iostream> #include <vector> #include <algorithm> #include <string> // 使用 constexpr 常量替代宏定义 constexpr long long HASH_BASE = 31; constexpr long long HASH_MOD = 1000000007; // 计算字符串的哈希值 long long hash(const std::string& s) { long long h = 0; for (char c : s) { h = ((h * HASH_BASE) % HASH_MOD + c) % HASH_MOD; } return h; } // 查找是否存在长度为 len 的重复子串 bool hasRepeatedSubstring(const std::string& s, int len) { if (len > s.length()) return false; std::vector<long long> hashes; long long basePower = 1; for (int i = 0; i < len; ++i) { basePower = (basePower * HASH_BASE) % HASH_MOD; } long long h = 0; for (int i = 0; i < s.length(); ++i) { h = ((h * HASH_BASE) % HASH_MOD + s[i]) % HASH_MOD; if (i >= len) { // 修正此处,确保 h 为非负数 h = (h - (s[i - len] * basePower) % HASH_MOD + HASH_MOD) % HASH_MOD; } if (i >= len - 1) { hashes.push_back(h); } } std::sort(hashes.begin(), hashes.end()); for (int i = 1; i < hashes.size(); ++i) { if (hashes[i] == hashes[i - 1]) { return true; } } return false; } // 二分查找最长重复子串的长度 int longestRepeatedSubstring(const std::string& s) { int left = 1, right = static_cast<int>(s.length()) - 1; int result = 0; while (left <= right) { int mid = left + (right - left) / 2; if (hasRepeatedSubstring(s, mid)) { result = mid; left = mid + 1; } else { right = mid - 1; } } return result; } int main() { std::string s = "abcabcbb"; int len = longestRepeatedSubstring(s); std::cout << "The length of the longest repeated substring is: " << len << std::endl; return 0; } ``` 上述代码通过修正子串哈希更新时可能出现负数的问题,能正确计算出字符串中最长重复子串的长度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值