蔷薇类系统发育中的基因顺序:从现存基因组的成对同线性推断
1. 引言
在植物研究中,推断共同基因组结构一直是一个传统方向,植物生物学家也对检测同线性很感兴趣。然而,为动物和酵母开发的自动祖先基因组重建方法,尚未应用于最近测序的植物基因组。原因主要有以下几点:
- 数据较新 :虽然近二十种双子叶被子植物已完成测序并发布,但大多是在近两年完成的。比较基因组学分析通常被测序联盟留作首次发表使用,数据发布后往往要等好几年才会进行分析。
- 计算成本高 :通过中位数构建等方法重建祖先基因组,最大化明确定义的目标函数的算法计算成本高昂。其计算复杂度随跨基因组的直系同源基因数量 (n) 增加,尤其与 (d^n) 相关((d) 是树分支上发生的重排数量)。
- 全基因组复制(WGD)影响 :WGD 在植物界,特别是被子植物中很普遍。它在经历 WGD 事件的物种和其他早期谱系物种之间设置了可比性障碍。WGD 产生的重复基因减少过程会以不可预测的方式分配重复基因对的存活成员,扰乱基因顺序和系统发育信号。此外,WGD 残留的重复基因对也会使直系同源性鉴定变得复杂。
- 基因互补限制 :全局重建方法最初假设基因组具有相同的基因互补,但对于双子叶植物,每增加一个研究的基因组,整个基因组集合的共同基因数量大约减少三分之一。比较六个基因组时,仅保留所有六个基因组共有的基因,会从每个基因组中移除 85% 的基因,严重影响局部同线性研究。
为解决这些问题,开发了祖先基因顺序重建算法 Pathgroups。该算法能处理大型植物基因组,包括 WGD
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



