187. 重复的DNA序列
所有 DNA 都由一系列缩写为 'A'
,'C'
,'G'
和 'T'
的核苷酸组成,例如:"ACGAATTCCG"
。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s
中出现次数超过一次。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:
输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
提示:
0 <= s.length <= 105
-
s[i]
为'A'
、'C'
、'G'
或'T'
题解:
使用单指针+Map进行求解
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
//定义一个结果集
List<String> res = new ArrayList<>();
//获取s字符串的长度
int n = s.length();
//如果此时n小于等于10,则一定不满足题设条件
if (n < 10) return res;
//定义一个map,存储子串以及其出现的次数
Map<String,Integer> map = new HashMap<>();
int right = 0;
while (right <= n - 10) {
String sub = s.substring(right,right + 10);
map.put(sub,map.getOrDefault(sub,0) + 1);
//只有在次数为2的时候的添加,起到次数大于2次去重的目的
if (map.get(sub) == 2) {
res.add(sub);
}
right++;
}
return res;
}
}