习题3-7(uva-1368)

DNA序列分析算法

原创已于 2022-07-12 20:46:09 修改 · 150 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #c++ #数据结构

于 2020-10-26 12:18:35 首次发布

算法入门第三章专栏收录该内容

12 篇文章

订阅专栏

本文介绍了一个用于DNA序列分析的算法，该算法通过读取多条DNA序列并统计每种碱基(A、C、G、T)出现的频率，进而找出最可能的碱基序列，并计算与该序列不匹配的碱基数。此算法适用于生物信息学中DNA序列的初步分析。

#include <iostream>
#include <vector>
#include <stack>
#include <list>
#include <map>
#include <set>
#include <deque>
#include <queue>
#include <cstring>
#include <unordered_map>
#include <unordered_set>
#include <algorithm>
#include <numeric>
#include <chrono>
#include <ctime>
#include <cmath>
#include <cctype>
#include <string>
#include <cstdio>
#include <iomanip>


#include <thread>
#include <mutex>
#include <condition_variable>
#include <functional>
#include <iterator>
using namespace std;
const int maxn = 1007;
const char str[] = { 'A','C','G','T' };

int f[maxn][4] = { 0 },m,n;
char input[maxn];

int GetIndex(char input) {
	switch (input)
	{
		case 'A':return 0;
		case 'C':return 1;
		case 'G':return 2;
		case 'T':return 3;
	}
	return 0;
}
int main()
{
	int t,id;
	cin >> t;
	while (t--) {
		memset(f, 0, sizeof(f));
		cin >> m >> n;
		cin.get();
		for (int i = 0; i < m; i++) {
			fgets(input, maxn, stdin);
			for (int j = 0; j < n; j++) {
				f[j][GetIndex(input[j])]++;
			}
		}
		int len = 0;
		for (int i = 0; i < n; i++) {
			id = 0;
			for (int j = 1; j < 4; j++) {
				if (f[i][j] > f[i][id])id = j;
			}
			input[i] = str[id];
			len += m - f[i][id];
		}
		input[n] = '\0';
		cout << input << endl;
		cout << len << endl;
	}
	return 0;
}