基因组研究中的前沿方法与成果
全基因组系统发育分析
随着测序基因组数量的迅速增加,我们有机会解决关于某些生物群体进化历史的长期问题,更好地理解进化过程,在功能基因组学方面取得重大进展,并搭建起基因组学与遗传学之间的桥梁。比较基因组学是全基因组分析中常用的方法,它强调“关联有罪”原则仍是全基因组分析的基本工具。然而,两两比较在全基因组分析中的局限性比在序列分析中更为严重,且对进化的解释能力有限。因此,基于基因组更大规模特征(如基因组重排、区域复制与丢失、调控模块和网络、染色质结构等)的系统发育研究显著增加。
但与编码序列分析相比,全基因组系统发育分析仍处于初级阶段。一方面,该分析起步较晚,虽然早在20世纪30年代就有人进行相关研究,但严肃的计算尝试还不到20年。另一方面,数据的复杂性使得设计简单有效的模型非常困难,即使是最简单模型中的许多问题在计算上也难以解决。例如:
- 序列分析通常以字符位置为基本单位,并假设位置间存在某种独立性,但比较基因组学中常用的基本单位(同线块)缺乏明确的定义。
- 目前缺乏能有效比对多个全基因组的工具,除非这些基因组关系非常密切。
- 计算基于大多数现存基因组重排或复制与丢失模型的三叶树简约得分是NP难题。
- 我们还没有对基于全基因组数据构建的系统发育树进行自展法分析的方法,也没有足够好的随机模型来推导似然得分。
不过,越来越多的研究小组正在致力于全基因组系统发育分析,进展迅速。目前存在的一些问题如下:
1. 同线块识别 :全基因组比较分析始于同线块的识别,即基因组间在一定容差范围内共享的连续区域。理想情况下,同线块应在进化背景下定义,但目前实际应用中使用了多种启
超级会员免费看
订阅专栏 解锁全文
850

被折叠的 条评论
为什么被折叠?



