题目:
描述:
一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。
给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
知识点: 字符串
题目来源: 内部整理
练习阶段: 初级
运行时间限制: 10Sec
内存限制: 128MByte
输入: 输入一个string型基因序列,和int型子串的长度
输出: 找出GC比例最高的字串
样例输入:
AACTGTGCACGACCTGA
5
样例输出:
GCACG
假设输入字符串为s输入整数为n,题目意思是:遍历输入字符串中每个n片段的子字符串,判断其含有G,C的数目为多少,然后把含有G,C数目最多的子字符串输出即可!
代码:
#include <iostream>
#include <string>
using namespace std;
int main(void)
{
string str,outstr="";
int n=1;
int i=0,j=0;
cin>>str;
cin>>n;
int times=str.length()-n+1;
int maxGC=0;
int GC;
for(i=0;i<times;i++)
{
GC=0;
for(j=0;j<n;j++)
{
if(str[i+j]=='G'||str[i+j]=='C')
GC++;
}
if(GC>maxGC)
{
maxGC=GC;
outstr=str.substr(i,n);
}
}
cout<<outstr;
return 0;
}
note:变量声明为字符串变量(string),而不是char 数组,好处在于,可以直接利用<string>头文件中自带的函数。