基于拓扑质心和树编辑距离的RNA二级结构比较方法
1. 引言
RNA是将遗传信息从DNA传递到蛋白质的重要生物分子。一些转录本,如核糖体RNA和转运RNA,无需翻译成蛋白质就能发挥作用。近年来,研究发现许多功能性非编码RNA在基因表达调控等方面发挥着重要作用。在生物信息学领域,由于RNA的结构和功能密切相关,通过比较RNA结构来预测其功能的方法被广泛采用。然而,分析RNA的三维结构在生物实验和计算实验中都非常困难,因此RNA二级结构常被用作适合计算处理和结构分析的数学表示。
但大多数现有的RNA二级结构分析方法不支持具有假结结构的RNA。假结是RNA二级结构中的一种特殊折叠模式,在生物体内发挥着重要作用。然而,与通常的碱基配对模式不同,假结不是嵌套的,这使得在计算机上处理具有假结的RNA极其困难。实际上,预测和比对具有假结的RNA二级结构都是非确定性多项式时间困难(NP - 困难)问题。因此,为了高效计算,假结结构常常被忽略或转换为无假结结构。
在二级结构比较中,处理具有假结的RNA也很困难。一般的方法是将其转换为树结构进行比较,但假结的结构复杂性使得这一过程变得困难。许多RNA比较算法仅限于无假结的结构,能够处理任意假结结构的二级结构的方法很少。本文将介绍一种新开发的实用算法,用于比较具有假结的RNA二级结构。该算法基于PEELING算法对表示RNA二级结构的输入平面图进行拓扑质心识别,并结合树编辑距离。
2. 材料
我们提供了一个名为planeGraph2tree的工具,它可以将输入的平面图转换为拓扑质心树,并基于树编辑距离进行比较。该工具可以从GitHub(https://github.com/feiqiwang/planeGra
超级会员免费看
订阅专栏 解锁全文
1348

被折叠的 条评论
为什么被折叠?



