题目来源:letcode
所有 DNA 都由一系列缩写为 ‘A’,‘C’,‘G’ 和 ‘T’ 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。
题解中给出哈希表解法给与了启示:
哈希表简单点来说不过是python中的字典,即记录每个关键词的位置存入表中。而本题中对应的关键词即为子序列,位置即可转为为次数。(说实话,感觉不像哈希表。
class Solution:
def findRepeatedDnaSequences(self, s: str) -> List[str]:
L=10
ans=[]
cnt=defaultdict(int)
for i in range(len(s)-L+1):
sub=s[i:i+L]
cnt[sub]+=1
if(cnt[sub]>=2):
ans.append(sub)
ans=list(set(ans))
return ans