同线性距离结构解析
1. 引言与基本概念
同线性距离模型中,染色体是一组 $n$ 个基因的子集,基因组是 $k$ 个染色体的集合。基因组可通过以下三种操作进行转换:
- 融合:$(S, T) \to U$,其中 $U = S \cup T$;
- 分裂:$S \to (T, U)$,其中 $T \cup U = S$;
- 易位:$(S, T) \to (U, V)$,其中 $U \cup V = S \cup T$。
两个基因组 $G1$ 和 $G2$ 之间的同线性距离是将 $G1$ 转换为 $G2$ 所需的最少操作数。
为了便于分析操作序列,采用紧凑表示法。对于将基因组 $G1$ 转换为 $G2$ 的实例,将 $G1$ 中每个基因 $a$ 重新标记为 $G2$ 中包含 $a$ 的染色体编号。例如,给定:
$G1 = {x, y}$(染色体 1),${p, q, r}$(染色体 2),${a, b, c}$(染色体 3)
$G2 = {p, q, x}$(染色体 1),${a, b, r, y, z}$(染色体 2)
$G1$ 相对于 $G2$ 的紧凑表示为 ${1, 2}$,${1, 2}$,${2}$;$G2$ 相对于 $G1$ 的紧凑表示为 ${1, 2}$,${1, 2, 3}$。用 $S(n, k)$ 表示紧凑表示中有 $n$ 个元素和 $k$ 个集合的同线性实例,$D(S(n, k))$ 表示解决该实例所需的最少操作数。
若两个集合 $S1$ 和 $S2$ 的交集不为空,则称它们是连通的,且属于同一个组件。对于基因 $\ell$,$count(\ell)$ 表示 $\ell$
超级会员免费看
订阅专栏 解锁全文
1506

被折叠的 条评论
为什么被折叠?



