习题3-7(uva-1368)

DNA序列分析算法
本文介绍了一个用于DNA序列分析的算法,该算法通过读取多条DNA序列并统计每种碱基(A、C、G、T)出现的频率,进而找出最可能的碱基序列,并计算与该序列不匹配的碱基数。此算法适用于生物信息学中DNA序列的初步分析。
#include <iostream>
#include <vector>
#include <stack>
#include <list>
#include <map>
#include <set>
#include <deque>
#include <queue>
#include <cstring>
#include <unordered_map>
#include <unordered_set>
#include <algorithm>
#include <numeric>
#include <chrono>
#include <ctime>
#include <cmath>
#include <cctype>
#include <string>
#include <cstdio>
#include <iomanip>


#include <thread>
#include <mutex>
#include <condition_variable>
#include <functional>
#include <iterator>
using namespace std;
const int maxn = 1007;
const char str[] = { 'A','C','G','T' };

int f[maxn][4] = { 0 },m,n;
char input[maxn];

int GetIndex(char input) {
	switch (input)
	{
		case 'A':return 0;
		case 'C':return 1;
		case 'G':return 2;
		case 'T':return 3;
	}
	return 0;
}
int main()
{
	int t,id;
	cin >> t;
	while (t--) {
		memset(f, 0, sizeof(f));
		cin >> m >> n;
		cin.get();
		for (int i = 0; i < m; i++) {
			fgets(input, maxn, stdin);
			for (int j = 0; j < n; j++) {
				f[j][GetIndex(input[j])]++;
			}
		}
		int len = 0;
		for (int i = 0; i < n; i++) {
			id = 0;
			for (int j = 1; j < 4; j++) {
				if (f[i][j] > f[i][id])id = j;
			}
			input[i] = str[id];
			len += m - f[i][id];
		}
		input[n] = '\0';
		cout << input << endl;
		cout << len << endl;
	}
	return 0;
}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值