最大四重奏一致性PTAS解读
在生物学和进化研究中,系统发育树是一种重要的工具,用于表示物种之间的进化关系。然而,从实际数据中构建准确的系统发育树是一个具有挑战性的问题,尤其是当数据量巨大时。本文将探讨最大四重奏一致性(MQC)问题及其近似算法,以及如何在采样数据的情况下高效地解决该问题。
1. 预备知识
- 系统发育树 :无根系统发育树是一种树,其内部顶点的度数均为3,叶子节点由一些分类单元集(代表现存物种)标记。对于树$T$,用$L(T)$表示对应于$T$叶子节点的分类单元集。
- 子树诱导 :设$T$是一棵树,$A⊆L(T)$是$T$叶子节点的一个子集,$T_A$是由$A$诱导的$T$的子树,即从$T$中移除$L(T)\backslash A$中的所有叶子节点以及仅通向它们的路径,然后收缩度数为2的内部顶点得到的树。
- 树的满足与违反 :对于两棵树$T$和$T’$,如果$L(T’)⊆L(T)$且$T_{L(T’)}=T’$,则称$T$满足$T’$,否则$T$违反$T’$。对于一组可能有重叠叶子节点的树$T = {T_1, \ldots, T_k}$,用$T_s(T)$表示$T$中被$T$满足的树的集合。如果存在一棵树$T^ $,它定义在叶子节点集合$\cup_iL(T_i)$上,并且满足$T$中的每棵树$T_i$,则称$T$是一致的,否则$T$是不一致的。当$T$不一致时,寻找一棵定义在$\cup_iL(T_i)$上的树$T^ $,使得某个目标函数最大化,$T^ $称为超树,寻找$T^
超级会员免费看
订阅专栏 解锁全文
47

被折叠的 条评论
为什么被折叠?



