187. 重复的DNA序列
所有 DNA 都由一系列缩写为 'A','C','G' 和 'T' 的核苷酸组成,例如:"ACGAATTCCG"。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:
输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
提示:
0 <= s.length <= 105s[i]为'A'、'C'、'G'或'T'
题解:
使用单指针+Map进行求解
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
//定义一个结果集
List<String> res = new ArrayList<>();
//获取s字符串的长度
int n = s.length();
//如果此时n小于等于10,则一定不满足题设条件
if (n < 10) return res;
//定义一个map,存储子串以及其出现的次数
Map<String,Integer> map = new HashMap<>();
int right = 0;
while (right <= n - 10) {
String sub = s.substring(right,right + 10);
map.put(sub,map.getOrDefault(sub,0) + 1);
//只有在次数为2的时候的添加,起到次数大于2次去重的目的
if (map.get(sub) == 2) {
res.add(sub);
}
right++;
}
return res;
}
}
该博客介绍了如何通过Java编程解决寻找DNA字符串中长度为10并出现两次以上的重复序列。利用单指针遍历DNA字符串,结合HashMap存储子串及其出现次数,实现高效查找。示例展示了在不同DNA字符串中的应用和结果。
3241

被折叠的 条评论
为什么被折叠?



