非编码RNA二级结构的进化保守性研究
在生物学研究中,非编码RNA(ncRNA)的结构和进化是一个重要的研究领域。本文将介绍相关的研究方法和工具,包括物种特异性替换检测、排名统计、选择分数计算、家族分歧分析、结构进化历史研究以及碱基对概率可视化等内容,同时还会详细说明软件的安装和使用方法。
1. 物种特异性替换检测
物种特异性替换检测模块的输入是多序列比对,对每一列进行单独探测。首先计算每个碱基的频率,然后将最频繁碱基的频率与阈值比较,判断是否为“优势碱基”。如果是,当某个碱基与优势碱基不同时,就检测到物种特异性替换;如果该列没有“优势碱基”,则不认为有物种特异性碱基。
2. 排名统计
插入缺失(indel)对ncRNA结构的影响问题目前还没有准确的模型。在SSS测试中,使用排名统计为观察到的indel生成p值,以指示其结构影响。具体步骤如下:
1. 计算物种结构与家族共识结构之间的距离。
2. 计算在中性模型下观察到该indel的可能性。通过对共识ncRNA的整个序列进行突变,获得与观察到的indel相同大小的缺失。
3. 计算突变序列在有和没有原始结构约束下的结构距离,这些计算得到的值形成排名。
4. 如果观察到的indel出现在较高排名(不太可能出现的indel),则获得低p值;如果出现在较低排名(可能出现的indel),则获得高p值。结构距离使用RNAforester计算。
5. 对所有indel的p值进行多重测试校正,然后将校正后的对数p值求和,得到indel分数。
3. 选择分数计算
为每个输入物种计算选择分数,使用以下公式:
[ score
超级会员免费看
订阅专栏 解锁全文
2633

被折叠的 条评论
为什么被折叠?



