DNA计算编码设计的探索
1. 二级结构测试
在DNA计算中,编码设计是一个关键环节,而二级结构测试是其中重要的一部分。研究发现,DNA编码应具有循环结构。这一设计原则源于对NJ算法的研究,其核心思想在于:一旦计算出DNA序列q的自由能表以及最小自由能,那么q的任何循环移位的相应计算就会变得容易。
1.1 复杂度分析
有命题指出,计算DNA码字q₁q₂…qₙ及其所有循环移位的自由能表的总体复杂度为O(n³)。证明过程如下:只需证明循环移位q = qₙq₁…qₙ₋₁的自由能表可以在O(n²)步骤内从q = q₁…qₙ的表中得到。q的位置1到n - 1和q 的位置2到n所包含的子序列集是相同的,这意味着只需要计算q*能量表第一行的条目。计算第一行的每个条目涉及O(n)次操作,因此总复杂度为O(n²)。
这种循环结构的编码带来了明显的优势。如果编码是循环的,测试一个包含M个长度为n的码字的DNA编码的二级结构的复杂度从O(Mn³)降低到O(Mn²)。此外,循环编码结构还能简化构成编码的DNA序列的实际生产过程。
1.2 实例分析
例如,图3(a)所示序列及其所有循环移位的最小自由能在 -0.24至 -0.41 kcal/mol范围内,这些序列都没有二级结构。而图3(b)中的序列,其所有循环移位都有二级结构,最小自由能在 -1.05至 -1.0 kcal/mol范围内。这些序列的实际构建在后续有相关描述,其二级结构是使用基于NJ算法的Vienna RNA/DNA二级结构包确定的,该包使用了更准确的参数值和复杂的碱基配对概率预测方法。
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



