基于模糊随机模型的快速RNA二级结构预测
1. 两种采样策略对比
为了更高效地进行RNA二级结构预测,研究人员提出了不同的采样策略。下面是传统策略和替代策略的详细对比:
| 方面 | 传统策略 | 替代策略 |
| — | — | — |
| 预处理时间 | 精确计算为 (O(n^3)),近似变体为 (O(n^2)),常数 (W_{exact} \geq 0) 时为 (O(n^2)) | 精确计算为 (O(n^3)),近似变体为 (O(n^2)),常数 (W_{exact} \geq 0) 时为 (O(n^3)) |
| 约束条件 | 无 | 有常数 (maxhairpin)、(maxbulge) 和 (maxstrand) |
| 特征与行动过程 | 固有控制、有序:
- 从左到右形成螺旋
- 采样“向内”进行:子结构 (S_{i,j}) 的构建从考虑 (R_{i,j}) 开始,以生成未配对区域(通常是发夹环)结束 | 更具自由度、限制较少:
- 螺旋顺序任意
- 采样“向外”进行:在未折叠片段 (R_{start,end}) 上构建新子结构从随机发夹环开始,扩展为完整有效的(配对)子结构 (S_{i,j}) |
| 采样方向的好处 | (子)结构的折叠与底层随机上下文无关文法(SCFG)生成的相应(唯一最左)推导(子)树一致 | 更能利用较短片段的内部概率,这些片段包含较少的近似项,因此误差较小(尽管外部值会在一定程度上限制这种优势) |
| 外部值的作用 | 不考虑(不影响采样分布) | 1) “归一化”采样概率
2) 确保有效扩展 |
| 有效选择的识别 | 不需要(所有可能的选择原