生物信息学中的树分析与蛋白质接触图预测
在生物信息学领域,树分析和蛋白质接触图预测是两个重要的研究方向。树分析有助于我们理解生物的进化关系,而蛋白质接触图预测则对蛋白质三维结构的预测有着重要意义。
树分析:KAST的应用与特性
在树分析中,KAST(Kernel of Maximum Agreement Subtrees)是一个关键的概念。研究人员使用了9000棵树来构建多数规则共识树,其拓扑结构与Philippe等人的补充图1基本相同。同时,还计算了这9000棵树的KAST。
为了测试树集中KAST的变异性,研究人员模拟Philippe等人每10个周期采样一次的方式,从9000棵树的集合中随机抽取900棵树计算KAST,并重复1000次。计算每对生成的KAST之间的对称Robinson - Foulds距离(由于KAST是二进制的,将其除以2),得到这些KAST之间的平均距离为0.73,平均KAST大小为10.73。
此外,研究人员还计算了不同数量树集的KAST大小,以测试样本大小对KAST大小的影响。结果如下表所示:
| 树的样本数量 | KAST大小 |
| ---- | ---- |
| 5000 | 11 |
| 2500 | 11 |
| 1200 | 11 |
| 500 | 11 |
| 250 | 开始增加 |
| 30 | 16 |
从表中可以看出,5000、2500、1200和500棵树的样本KAST大小均为11,从250棵树的样本开始,KAST大小开始增加,30棵树的样本KAST大小为16。虽然9000棵树的整个集合的KAST显然更保守,
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



