算法竞赛入门-DNA序列(DNA Consensus String)

本文介绍了如何解决算法竞赛中的DNA序列问题,目标是找到与所有给定DNA序列Hamming距离最小的序列。文章通过分析思路,提出通过计算每列出现最频繁的字母来确定最优解,并提供了实现这一方法的代码。

1.题目

 今天第一题

输入m个长度均为n的DNA序列,求一个DNA序列,到所有序列的总Hamming距离尽量 小。 两个等长字符串的Hamming距离等于字符不同的位置个数,例如,ACGT和GCGA的 Hamming距离为2(左数第1, 4个字符不同)。输入整数m和n(4≤m≤50, 4≤n≤1000),以及m个长度为n的DNA序列(只包含字母 A,C,G,T),输出到m个序列的Hamming距离和最小的DNA序列和对应的距离。 如有多解,要求为字典序最小的解。 例如,对于下面5个DNA序列,最优解为TAAGATAC。

TATGATAC

TAAGCTAC

AAAGATCC

TGAGATAC

TAAGATGT

2.思路

  获取每列的出现次数最多的字母即可。 如果要求hamming,则对每列执行(m减去该列次数最多的字母),相加其中的结果即可。

3.代码

package basic.第三章;

import java.util.Scanner;

/**
 * DNA序列(DNA Consensus String)
 * 题目:
 * 输入m个长度均为n的DNA序列,求一个DNA序
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值