RNA结构预测:从传统算法到线性时间算法的革新
RNA在众多生物过程中扮演着关键角色,其功能与结构密切相关。然而,通过实验方法确定RNA结构既昂贵又耗时,因此,快速准确的RNA结构计算预测方法显得尤为重要。其中,RNA二级结构预测,即预测RNA分子中所有规范碱基对(A - U、G - C、G - U)的集合,是一个重要且具有挑战性的问题。
传统算法的局限性
现有的基于动态规划的算法,包括经典的最小自由能(MFE)方法和配分函数方法,存在一个主要局限:它们的运行时间与RNA长度的立方成正比。这种缓慢的计算速度限制了它们在全基因组应用中的使用。例如,广泛使用的RNAstructure、Vienna RNAfold和CONTRAfold等系统,虽然在实现上进行了优化以提高速度,但对于长RNA序列,其运行时间仍然过长。
为了加速预测速度,一些系统提供了局部折叠选项,如RNAfold的 --maxBPspan 参数,允许预测短于给定阈值的碱基对。但这种方法忽略了所有超出窗口大小阈值的长距离碱基对,而研究表明,长碱基对在天然RNA结构中实际上很常见。
线性时间启发式算法的出现
为了克服传统算法的速度瓶颈,研究人员设计了线性时间启发式算法LinearFold和LinearPartition,用于近似MFE结构、配分函数和碱基配对概率。
LinearFold
LinearFold是一种线性时间、线性空间的近似算法,用于预测MFE结构。它结合了增量动态规划和束搜索近似方法,提供了基于热力学模型和机器学习模型的选项。
- 工作原理 </
超级会员免费看
订阅专栏 解锁全文
1705

被折叠的 条评论
为什么被折叠?



