题目:
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入一个string型基因序列,和int型子串的长度。找出GC比例最高的子串,如果有多个输出第一个的子串。
#include <iostream>
#include <cstring>
#include <string>
#include <algorithm>
using namespace std;
int main()
{
string str;
int num;
while (cin >> str >> num)
{
int len = str.length();
int maxIndex=0, maxNum=0, gcNum = 0;
int a[100];
for (int i = 0; i < len-num; i++)
{
for (int j = i; j < i+num; j++)//两个for循环表示每次从序列中取5位子序列
{
if (str[j] == 'G' || str[j] == 'C')
gcNum++;
}
a[i] = gcNum;
gcNum = 0;
if (a[i] > maxNum)
{
maxNum = a[i];
maxIndex = i;
}
}
for (int j = maxIndex; j < maxIndex + num; j++)
{
cout << str[j];
}
}
return 0;
}