利用结构参数期望评估RNA二级结构预测质量
1. 研究背景与目标
在RNA研究领域,准确预测其二级结构至关重要。为了实现这一目标,我们借助随机上下文无关文法(SCFGs)来推导概率生成函数,从而得出与RNA二级结构预期形状相关的定量结果。这些结果将作为评估预测质量的基础。
2. 推导预期结构
为了训练文法,我们构建了一个Motzkin单词数据库,它与Wuyts等人数据库中的二级结构一一对应。同时,我们还使用了Brown的RNase P序列数据库和Sprinzl等人的tRNA分子数据库。
我们使用在Wuyts等人数据库所有条目上训练概率的SCFG,推导出大亚基(LSU)核糖体RNA分子结构参数的预期值,如发夹环的平均数量和长度、多环的平均度数等。相关公式见表1:
| 参数 | 预期值 |
| — | — |
| 发夹数量 | 0.0226n |
| 发夹环长度 | 7.3766 |
| 凸起数量 | 0.0095n |
| 凸起长度 | 1.5949 |
| 阶梯数量 | 0.0593n |
| 阶梯长度(对数) | 4.1887 |
| 内环数量 | 0.0164n |
| 内环中单环长度 | 3.8935 |
| 多环数量 | 0.0106n |
| 多环度数 | 4.1311 |
| 多环中单环长度 | 4.3686 |
| 单链区域数量 | 18.1679 |
| 单链区域长度 | 18.1353 |
为推导这些结果,我们使用了以下文法(所有大写字母为中间符号):
超级会员免费看
订阅专栏 解锁全文
3074

被折叠的 条评论
为什么被折叠?



