29、DNA片段组装:蚁群系统方法

DNA片段组装:蚁群系统方法

1. 引言

为了了解生物体的整个基因构成,需要有关整个DNA(脱氧核糖核酸)序列的信息。人类基因组计划就是这样一个著名的研究项目,它对人类基因组中超过30亿个遗传密码的整个DNA序列进行了研究。为实现这一目标,该项目需分为多个组件,其中一个主要组件就是DNA片段组装。

DNA是由两条互补的多核苷酸链组成的双螺旋结构。每条DNA链可看作由A、G、C、T四个字母组成的字符串,这四个字母分别代表腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。两条链是互补的,即A总是与T配对,C总是与G配对,这些互补碱基对被称为“碱基对”。目前,长度超过600个碱基对的DNA链无法常规准确测序,因此需要采用鸟枪法测序技术,即将DNA多次复制,然后将双螺旋的单链随机断裂成较小的片段,得到一组无序的、足够短以便测序的片段。

DNA片段组装问题就是要找到每个片段在排序序列中的正确顺序,从而形成一个能真实反映原始DNA链的共识序列,这可被视为一个组合优化问题。此前已有许多确定性和随机搜索技术用于解决该问题:
- 确定性搜索技术 :如贪婪搜索算法,但需要对计算机生成的结果进行手动操作才能得到具有生物学合理性的最终结果;还有分支切割算法、图论算法等。
- 随机搜索技术 :如模拟退火算法、遗传算法和基于神经网络的预测技术等。其中,遗传算法在相对小规模问题中已被证明优于贪婪搜索技术,且无需手动干预。然而,遗传算法在搜索过程中使用排列表示法会导致解表示的冗余,从而降低算法效率。而蚁群系统(ACS)算法则不受此影响。

蚁群算法的自然隐喻源于蚁群行为。真实的蚂蚁能够利用信

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值