RNA结构相似度计算:理论、算法与近似方案
1. 映射与距离关系
在RNA结构的研究中,编辑操作序列与映射之间存在着紧密的联系。给定从RNA结构R1到R2的编辑操作序列S,存在一个从R1到R2的映射M,使得γ(M) ≤ γ(S)。反之,对于任何映射Me,也存在一个编辑操作序列,使得γ(S) = γ(M)。这个结论可以通过对编辑操作序列的长度k进行归纳证明。当k = 1时,单个编辑操作能保持映射条件,结论成立。在一般情况下,设S1为前k - 1个编辑操作的序列,存在映射M1使得γ(M1) ≤ γ(S1),设M2为第k个编辑操作的映射,根据引理1可得γ(M1 ◦ M2) ≤ γ(M1) + γ(M2) ≤ γ(S)。
基于此引理,得出距离与映射的关系定理:D(R1, R2) = min {γ(M) | M是从R1到R2的映射}。这个定理表明,两个RNA结构之间的距离等于所有可能映射中代价最小的那个映射的代价。
2. NP - 难问题证明
当比较的两个RNA结构均为三级结构时,该问题通常是NP - 难的。通过将3 - SAT问题归约到这个问题来证明。
2.1 3 - SAT问题实例
设S = C1 · C2…Cn,其中Ci = (vi1 ∪ vi2 ∪ vi3),是一个3 - SAT问题的实例。
2.2 构建RNA结构
- R1结构 :有n个片段,每个片段由四个AU碱基对包围,且每个片段通过四个CG碱基对与其他片段相连。R1中碱基对的数量为4 · n · (1 + (n - 1)/2)。
超级会员免费看
订阅专栏 解锁全文
109

被折叠的 条评论
为什么被折叠?



