爱奇艺 :DNA序列

本文介绍了一个算法挑战,目标是从DNA序列中找出最短未出现的片段长度。通过使用C++编程,我们探讨了如何统计所有可能的DNA片段,并确定了缺失片段的最小长度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 题目描述
    牛牛又从生物科研工作者那里获得一个任务,这次牛牛需要帮助科研工作者从DNA序列s中找出最短没有出现在DNA序列s中的DNA片段的长度。
    例如:s = AGGTCTA
    序列中包含了所有长度为1的(‘A’,‘C’,‘G’,‘T’)片段,但是长度为2的没有全部包含,例如序列中不包含"AA",所以输出2。

输入描述:
输入包括一个字符串s,字符串长度length(1 ≤ length ≤ 2000),其中只包含’A’,‘C’,‘G’,'T’这四种字符。
输出描述:
输出一个正整数,即最短没有出现在DNA序列s中的DNA片段的长度。
输入
AGGTCTA
输出
2

  • 思路
    这个题主要是理解题意,字符串由’A’,‘C’,‘G’,'T’四种字符组成,长度为一的片段为A,G,C,T。长度为二的片段为AA,AC,AG,AT,CA,CG,CC,CT,GA,GC,GG,GT,TA,TC,TG,TT。因此,长度为n的片段有4^n种。可以利用set统计有多少种,如果小于的话,则输出。
  • c++实现
#include <iostream>
#include <string>
#include <set>
#include <math.h>
using namespace std;
int main()
{
 string s;
 cin>>s;
    if(s.length()<=1) cout<<s.length()<<endl;
 for(int i=1;i<s.length();i++)
 {
  set<string> arr;
  for(int j=0;j<s.length()-i;j++)
   arr.insert(s.substr(j,i));
  if(arr.size()<pow(4,i))
  {
   cout<<i<<endl;
   break;
  }
 }
 return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值