基因工程 HihoCoder - 1052(有意思)

探讨了一项关于基因序列的算法问题,目标是最少修改次数使序列两端的K个碱基匹配。通过巧妙的分块策略和比较字符频率,实现高效求解。

小Hi和小Ho正在进行一项基因工程实验。他们要修改一段长度为N的DNA序列,使得这段DNA上最前面的K个碱基组成的序列与最后面的K个碱基组成的序列完全一致。  

例如对于序列"ATCGATAC"和K=2,可以通过将第二个碱基修改为"C"使得最前面2个碱基与最后面两个碱基都为"AC"。当然还存在其他修改方法,例如将最后一个碱基改为"T",或者直接将最前面两个和最后面两个碱基都修改为"GG"。

小Hi和小Ho希望知道在所有方法中,修改碱基最少的方法需要修改多少个碱基。

Input

第一行包含一个整数T(1 <= T <= 10),代表测试数据的数量。

每组测试数据包含2行,第一行是一个由"ATCG"4个大写字母组成的长度为N(1 <= N <= 1000)的字符串。第二行是一个整数K(1 <= K <= N)。

Output

对于每组数据输出最少需要修改的碱基数量。

Sample Input

2  
ATCGATAC  
2  
ATACGTCT
6 

Sample Output

1  
3   

这道题目一开始完全没有思路。后来看了大神的代码,还是大佬牛逼,什么都可以想出来。

题意是一段字符串,然后截取前K个,在从后往前截取K个,就这两段字符串进行对比,然后你可以改变一些字符。使这两个字符串完全匹配,输出这个最小的改变字符的数量。题意就是这么的简单,但是我不会做这道题,题意再简单也没有用。看了大神的代码,我就用手在纸上画了画模拟的过程。确实很奇妙。

例如 ABCDAB 这个字符串,我们都知道最后的换取结果是 ABABAB,换掉C和D ,就可以了。但是这个过程计算机怎么实现呢?首先列出截取4个后的两个字符串,为 ABCD CDAB ,因为是有交叉字符出现的情况,可能我们还掉一个就可以使很多字符都可以相同的。两个字符串一 一对应后,(下标我先定为从1开始)1,3,5,是对应的,而2,4,6,这个循环节是(n-k)(n是长度,k世是截取数量),是对应的位置,我们就可以将这个问题换成1,3,5   和2,4,6 这两块问题了,看怎么换掉才是最小的数量。分块数量是for(int i=0;i<(循环节);i++) ,这样就将问题分为好几个块,这样就将问题简单化。

然后,就是找到最小的数量,就是 比如   ABCDAB 这样的 截取4个 的时候, C ,D字符是重复的,所以现在就可以比较A,C,A的数量,因为 A,C 是对应的 ,这个 C与下一个A ,也是对应的,这个C出现2次,另外两个 A出现1次,我们人脑想想也是将C换成A,换成数量多的那一个(A有2个,C有一个) ,所以就将C换为A,这个就是最少的换的字符了。每一次分块都是这样算。

 

#include<iostream>
#include<cstdio>
#include<queue>
#include<algorithm>
#include<set>
#include<vector>
const int maxn=100005;
using namespace std;
#include<map>
#include<string>
#include<string.h>
typedef long long ll;

int main()
{
	int t;
	scanf("%d",&t);
	char s[maxn];
	int k;
	while(t--)
	{
		scanf("%s",s);
		scanf("%d",&k); 
		
		int len=strlen(s);
		if(2*k<=len)
			{
				int ans=0;
				for(int i=0;i<k;i++)
				{
					if(s[i]!=s[len-k+i])
						ans++;
						
										
				}
				
			printf("%d\n",ans);
			}
		else	
		{
			int ans=0;
			
			int jie=len-k;
			for(int i=0;i<jie;i++)
			{
				int a[4]={0};
				for(int j=i;j<len;j+=jie)
				{
					if(s[j]=='A')
						a[0]++;
					else if(s[j]=='T')
						a[1]++;
					else if(s[j]=='G')
						a[2]++;	
					else if(s[j]=='C')
						a[3]++;
												
				}
				int maxshu=-1;
				int sum=0;
				
				for(int j=0;j<4;j++)
				{
					maxshu=max(maxshu,a[j]);
					sum+=a[j];
				}
				
				ans+=sum-maxshu;
				
				
			}
			
			printf("%d\n",ans);
		}
		
	}
	
	
	
	
	
	
	return 0;
}

思路就是这样。 很巧妙。                                      

 

源码地址: https://pan.quark.cn/s/a4b39357ea24 遗传算法 - 简书 遗传算法的理论是根据达尔文进化论而设计出来的算法: 人类是朝着好的方向(最优解)进化,进化过程中,会自动选择优良基因,淘汰劣等基因。 遗传算法(英语:genetic algorithm (GA) )是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。 进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择、杂交等。 搜索算法的共同特征为: 首先组成一组候选解 依据某些适应性条件测算这些候选解的适应度 根据适应度保留某些候选解,放弃其他候选解 对保留的候选解进行某些操作,生成新的候选解 遗传算法流程 遗传算法的一般步骤 my_fitness函数 评估每条染色体所对应个体的适应度 升序排列适应度评估值,选出 前 parent_number 个 个体作为 待选 parent 种群(适应度函数的值越小越好) 从 待选 parent 种群 中随机选择 2 个个体作为父方和母方。 抽取父母双方的染色体,进行交叉,产生 2 个子代。 (交叉概率) 对子代(parent + 生成的 child)的染色体进行变异。 (变异概率) 重复3,4,5步骤,直到新种群(parentnumber + childnumber)的产生。 循环以上步骤直至找到满意的解。 名词解释 交叉概率:两个个体进行交配的概率。 例如,交配概率为0.8,则80%的“夫妻”会生育后代。 变异概率:所有的基因中发生变异的占总体的比例。 GA函数 适应度函数 适应度函数由解决的问题决定。 举一个平方和的例子。 简单的平方和问题 求函数的最小值,其中每个变量的取值区间都是 [-1, ...
《基于STM32微控制器集成温湿度监测与显示功能的系统实现方案》 本方案提供了一套完整的嵌入式系统设计参考,实现了环境参数的实时采集、可视化呈现与异常状态提示。系统核心采用意法半导体公司生产的STM32系列32位微控制器作为主控单元,负责协调各外设模块的工作流程。 系统通过数字式温湿度复合传感器周期性获取环境参数,该传感器采用单总线通信协议,具有响应迅速、数据可靠的特点。采集到的数值信息通过两种途径进行处理:首先,数据被传输至有机发光二极管显示屏进行实时图形化显示,该显示屏支持高对比度输出,能够在不同光照条件下清晰呈现当前温度与湿度数值;其次,所有采集数据同时通过通用异步收发传输接口输出,可供上位机软件进行记录与分析。 当监测参数超出预设安全范围时,系统会启动声学警示装置,该装置可发出不同频率的提示音,以区分温度异常或湿度异常状态。所有功能模块的驱动代码均采用模块化设计原则编写,包含完整的硬件抽象层接口定义、传感器数据解析算法、显示缓冲区管理机制以及串口通信协议实现。 本参考实现重点阐述了多外设协同工作的时序控制策略、低功耗数据采集模式的应用方法,以及确保系统稳定性的错误处理机制。代码库中包含了详细的初始化配置流程、中断服务程序设计和各功能模块的应用程序接口说明,为嵌入式环境监测系统的开发提供了可靠的技术实现范例。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值