基因树与物种树的调和问题研究
1. 引言
在生物进化研究中,基因树和物种树的调和问题一直是一个重要的研究方向。计算最优物种树在特定限制下的复杂度是研究的重点之一。已有研究表明,在基因树中标签(基因拷贝)出现次数无界的情况下,基于基因树重建物种树的问题是NP难的。为了解决这一问题,本文提出了基于范例分析的新方法,并对相关问题的复杂度进行了深入研究。
2. 基因树与物种树的基本概念
- 树的类型 :本文主要关注进化树,包括物种树和基因树。除非特别说明,所有树均为二叉树且有根。树的叶子节点有标签,内部节点无标签。
- 物种树 :物种树的叶子节点标签唯一,即没有两个叶子节点具有相同的标签。对于物种树S的节点x,其簇C(x)定义为x的所有叶子后代节点标签的集合。
- 基因树 :基因树的两个叶子节点可能具有相同的标签,因此对于基因树G的内部节点g,其后代叶子节点的标签构成一个多重集。同样,基因树节点g的簇C(g)定义为g的所有叶子后代节点标签的集合。
- LCA映射 :给定基因树G和物种树S的对(G, S),lca映射是一个函数,它将G的每个节点g映射到S的节点s,使得C(s)是包含C(g)的S的最小簇。
- 复制距离 :当G的节点g及其一个或两个子节点通过lca映射到S的同一节点x时,称在g处发生了一次复制。lca映射引起的复制次数称为基因树G到物种树S的复制距离,记为d(G, S)。
超级会员免费看
订阅专栏 解锁全文
76

被折叠的 条评论
为什么被折叠?



