直接上Leetcode例题:
题目要求子串中的每一字符出现次数都不能少于k, k 在参数中给出,举个栗子: 字符串 "aaabb",这时 k = 3,它的最长子串为 "aaa"。因为a字符出现了3次,而b字符只出现了两次。同理,在字符串"ababbc"中,c字符只出现了1次,题目要求子串中每一字符出现两次,因此最长子串只能是"ababb"。
再来看一个字符串:
"dddxaabaaabaacciiiiefbff", k = 3
因为 k = 3,我们需要把原始字符串中字符出现次数小于3的字符剔除掉,其中x出现一次,c出现两次,e出现一次,将来组合子串的时候,谁带上它们谁倒霉~
比如说,"dddx"中x字符只出现了一次,小于 k ,不满足要求,但是把x从中剔除就可以满足要求。所以,第一步先要把出现次数小于3的字符剔除。
经过分析如下图:
其中b字符虽然在原始字符串中出现了3次,但经过一次切割后在1号字符串中只出现了两次,同样不符合要求,在第二次操作中被剔除。
核心思想:统计字符串中每个字符的出现次数,移除那些出现次数 < k 的字符,
剩余的子串,递归做此处理,直至
- 整个子串长度 < k (排除)
- 子串中没有出现次数 < k 的字符
代码实现:
import java.util.Arrays;
/**
* 至少 k 个字符的最长子串
*/
public class LongestSubstringLeetcode395 {
public static int longestSubstring(String s, int k) {
//子串落选情况
if(s.length() < k){
return 0;
}
int[] counts = new int[26];
char[] chars = s.toCharArray();
for (char c : chars) {
counts[c - 97]++;
}
System.out.println(Arrays.toString(counts));
for (int i = 0; i < chars.length; i++) {
char c = chars[i];
int count = counts[c - 97]; //字符出现次数
if(count > 0 && count < k){
int j = i + 1;
while(j < s.length() && counts[chars[j] - 97] < k){
j++;
}
return Integer.max(longestSubstring(s.substring(0, i), k),
longestSubstring(s.substring(j), k));
}
}
//子串入选情况
return s.length(); //循环整个字符串都没有找到出现次数小于k的字符
}
public static void main(String[] args) {
System.out.println(longestSubstring("aaaccbbb", 3)); // ababb
//System.out.println(longestSubstring("dddxaabaaabaacciiiiefbff", 3));
// System.out.println(longestSubstring("ababbc", 3)); // ababb
// System.out.println(longestSubstring("ababbc", 2)); // ababb
}
}
运行结果: