- 题目描述
牛牛又从生物科研工作者那里获得一个任务,这次牛牛需要帮助科研工作者从DNA序列s中找出最短没有出现在DNA序列s中的DNA片段的长度。
例如:s = AGGTCTA
序列中包含了所有长度为1的(‘A’,‘C’,‘G’,‘T’)片段,但是长度为2的没有全部包含,例如序列中不包含"AA",所以输出2。
输入描述:
输入包括一个字符串s,字符串长度length(1 ≤ length ≤ 2000),其中只包含’A’,‘C’,‘G’,'T’这四种字符。
输出描述:
输出一个正整数,即最短没有出现在DNA序列s中的DNA片段的长度。
输入
AGGTCTA
输出
2
- 思路
这个题主要是理解题意,字符串由’A’,‘C’,‘G’,'T’四种字符组成,长度为一的片段为A,G,C,T。长度为二的片段为AA,AC,AG,AT,CA,CG,CC,CT,GA,GC,GG,GT,TA,TC,TG,TT。因此,长度为n的片段有4^n种。可以利用set统计有多少种,如果小于的话,则输出。 - c++实现
#include <iostream>
#include <string>
#include <set>
#include <math.h>
using namespace std;
int main()
{
string s;
cin>>s;
if(s.length()<=1) cout<<s.length()<<endl;
for(int i=1;i<s.length();i++)
{
set<string> arr;
for(int j=0;j<s.length()-i;j++)
arr.insert(s.substr(j,i));
if(arr.size()<pow(4,i))
{
cout<<i<<endl;
break;
}
}
return 0;
}