UVA - 1368 DNA Consensus String :简单字符串处理

本文介绍了一种用于DNA序列比对的算法实现,通过统计每条输入DNA序列中A、G、C、T四种碱基的数量,并找出每种碱基在对应位置上出现次数最多的一个,从而构建出一个最相似的参考序列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

思路:用4个数组 存放每个字符串中对应元素下标的A G C T 的个数

比如,所给样例①中 A[0]=1,G[0]=0,C[0]=0, TT[0]=4;

这样,在 A G C T 对应下标寻找出现次数最多的,同时为最终字符串贡献一个字符;

由于按照ACGT的顺序比较 保证了出现次数相同的情况下 字典序最小的那个字符作为最终输出字符串的贡献字符;

                    #define LOCAL
#include<iostream>
#include<cstdio>
#include<cstring>
#include<string>
using namespace std;
const int Size = 1000;
int A[Size+5];
int G[Size+5];
int C[Size+5];
int TT[Size+5];

int main()
{
#ifdef LOCAL
    freopen("in1.txt","r",stdin);
#endif
    int T, m,n;
    string S;
    scanf("%d",&T);
    while(T--){
        scanf("%d %d",&m,&n);
        memset(A,0,sizeof(A));
        memset(G,0,sizeof(G));
        memset(C,0,sizeof(C));
        memset(TT,0,sizeof(TT));
        int AnsN=0; string AnsS="";
        int M=m;
        while(m--){
            cin>>S;
            for(int i=0; i<n; i++){
                if(S[i]=='A') A[i]++;
                if(S[i]=='G') G[i]++;
                if(S[i]=='C') C[i]++;
                if(S[i]=='T') TT[i]++;
            }
        }
        int Max=-1;
        char MaxX;
        for(int i=0; i<n; i++){
            Max = A[i]; MaxX = 'A';
            if(C[i]>Max) { Max=C[i]; MaxX='C'; }
            if(G[i]>Max) { Max=G[i]; MaxX='G'; }
            if(TT[i]>Max) { Max=TT[i]; MaxX='T'; }
            AnsN+=(M-Max); AnsS+=MaxX;
        }
        cout<<AnsS<<endl;
        printf("%d\n",AnsN);
    }//while
    return 0;
}

额···表述能力果然很烂····

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值