1 题目:最小基因变化
官方标定难度:中
基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 ‘A’、‘C’、‘G’ 和 ‘T’ 之一。
假设我们需要调查从基因序列 start 变为 end 所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。
例如,“AACCGGTT” --> “AACCGGTA” 就是一次基因变化。
另有一个基因库 bank 记录了所有有效的基因变化,只有基因库中的基因才是有效的基因序列。(变化后的基因必须位于基因库 bank 中)
给你两个基因序列 start 和 end ,以及一个基因库 bank ,请你找出并返回能够使 start 变化为 end 所需的最少变化次数。如果无法完成此基因变化,返回 -1 。
注意:起始基因序列 start 默认是有效的,但是它并不一定会出现在基因库中。
示例 1:
输入:start = “AACCGGTT”, end = “AACCGGTA”, bank = [“AACCGGTA”]
输出:1
示例 2:
输入:start = “AACCGGTT”, end = “AAACGGTA”, bank = [“AACCGGTA”,“AACCGCTA”,“AAACGGTA”]
输出:2
示例 3:
输入:start = “AAAAACCC”, end = “AACCCCCC”, bank = [“AAAACCCC”,“AAACCCCC”,“AACCCCCC”]
输出:3
提示:
start.length == 8
end.length == 8
0 <= bank.length <= 10
bank[i].length == 8
start、end 和 bank[i] 仅由字符 [‘A’, ‘C’, ‘G’, ‘T’] 组成
2 solution
可以用广度优先搜索,因为bank规模很小,只需要遍历 bank 找到可以互相转换的关系,然后直接用 index 代替基因搜索即可
代码
class Solution {
/*
* 1 先将 bank 和 startGene 映射成数字,并找到相邻关系
* 2 采用广度优先搜索
*/
public:
int minMutation(string startGene, string endGene, vector<string> &bank) {
int n = bank.size();
int e = find(bank.begin(), bank.end(), endGene) - bank.begin();
if (e == n) return -1;
// cout << e << endl;
if(startGene == endGene) return 0;
int s = find(bank.begin(), bank.end(), startGene) - bank.begin();
// cout << s << endl;;
if (s == n) bank.push_back(startGene), n++;
vector<vector<bool>> dis(n, vector<bool>(n));
for (int i = 0; i < n; i++) {
for (int j = i + 1; j < n; j++) {
int cnt = 0;
for(int k = 0; k < 8; k++){
if(bank[i][k] != bank[j][k]){
cnt++;
}
}
if(cnt == 1){
dis[i][j] = dis[j][i] = 1;
// cout << i << j << endl;
}
}
}
queue<int> q;
q.push(s);
vector<int> step(n, -1);
step[s] = 0;
while (q.size()){
int u = q.front();
q.pop();
for(int i = 0; i < n; i++){
if(step[i] == -1 && dis[u][i]){
step[i] = step[u] + 1;
if(i == e) return step[i];
q.push(i);
}
}
}
return -1;
}
};