LeetCode每日一题之187重复的DNA序列

最新推荐文章于 2025-11-24 16:32:05 发布

原创最新推荐文章于 2025-11-24 16:32:05 发布 · 245 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#leetcode #算法

LeetCode每日一题专栏收录该内容

21 篇文章

订阅专栏

该博客介绍了如何通过Java编程解决寻找DNA字符串中长度为10并出现两次以上的重复序列。利用单指针遍历DNA字符串，结合HashMap存储子串及其出现次数，实现高效查找。示例展示了在不同DNA字符串中的应用和结果。

187. 重复的DNA序列

187.重复的DNA序列

所有 DNA 都由一系列缩写为 'A'，'C'，'G' 和 'T' 的核苷酸组成，例如："ACGAATTCCG"。在研究 DNA 时，识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来找出所有目标子串，目标子串的长度为 10，且在 DNA 字符串 s 中出现次数超过一次。

示例 1：

输入：s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出：["AAAAACCCCC","CCCCCAAAAA"]

示例 2：

输入：s = "AAAAAAAAAAAAA"
输出：["AAAAAAAAAA"]

提示：

0 <= s.length <= 105
s[i] 为 'A'、'C'、'G' 或 'T'

题解：

使用单指针+Map进行求解

class Solution {
    public List<String> findRepeatedDnaSequences(String s) {
        //定义一个结果集
        List<String> res = new ArrayList<>();
        //获取s字符串的长度
        int n = s.length();
        //如果此时n小于等于10，则一定不满足题设条件
        if (n < 10) return res;
        //定义一个map，存储子串以及其出现的次数
        Map<String,Integer> map = new HashMap<>();
        int right = 0;
        while (right <= n - 10) {
            String sub = s.substring(right,right + 10);
            map.put(sub,map.getOrDefault(sub,0) + 1);
            //只有在次数为2的时候的添加，起到次数大于2次去重的目的
            if (map.get(sub) == 2) {
                res.add(sub);
            }
            right++; 
        }
        return res;
    }
}