最大一致子树的核心:KAST 算法解析与应用
在生物信息学和系统发育分析中,处理多棵系统发育树时,找到它们之间的共同结构是一个重要的问题。最大一致子树(MAST)和核心一致子树(KAST)的概念为此提供了有效的解决方案。本文将深入探讨 MAST 和 KAST 的定义、性质、计算算法以及它们在实际应用中的表现。
1. 基本定义
- 树与标签 :考虑一组树 $T = {T_1, T_2, \ldots, T_k}$ 和一组标签 $L$,其中每个 $x \in L$ 恰好标记每棵 $T_i$ 的一个叶子节点。
- 限制树 :将树限制到其叶子集 $L$ 的子集 $L’$ 上,$T_i|L’$ 是 $T_i$ 的最小同胚子树,其叶子集为 $L’$。
- 一致子树 :对于树集 $T$,一致子树是一个子集 $L’ \subseteq L$,使得 $T_1|L’ = T_2|L’ = \cdots = T_k|L’$。
- 最大一致子树(MAST) :最大一致子树是最大规模的一致子树,所有最大一致子树的集合记为 $M$。
- 核心一致子树(KAST) :核心一致子树是所有 MAST 的交集,即 $KAST = \cap_{T \in M}T$。
2. MAST 和 KAST 的性质
- 计算复杂度 :目前已知最快的 MAST 计算算法由
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



