参考锚定基因块的双团方法
1. 问题背景与定义
在基因研究领域,寻找保守基因簇是一个重要问题。我们的问题与基因团队发现问题相关,该问题有多种模型。最基本的模型中,染色体被视为不同基因的排列,基因团队是在所有指定物种中出现的基因集合,相邻基因距离有阈值限制,此模型还可推广到考虑同一基因的旁系同源副本。进一步推广则是寻找仅在给定基因组子集中出现的基因团队,这使问题变为NP完全问题。
1.1 问题定义的基本概念
- 基因表示 :用有限字符集Σ表示基因,基因组由字符序列S = σ1 · · · σn表示,|S|表示序列长度,S[i]表示第i个字符。
- 子序列与区间 :S的子序列是通过删除零个或多个字符得到的非空序列,区间是具有连续字符的子序列,S[i, j]表示从位置i到j的区间。
- 排列与等价序列 :所有字符不同的序列称为排列,若两个序列S1和S2对所有σ ∈Σ,出现的每个字符σ的数量相同,则称它们等价,记为S1 ≡S2。
1.2 参考锚定基因块问题(RAGB)
- 问题实例 :由三元组(Q, I, d)定义,Q是指定参考元素的序列,T = {T1, . . . , TC}是目标基因组的序列集合,d是正整数,I = {I1, . . . , IC}是区间集族,每个Ii包含Ti的区间。
- 块的定义 :(Q, I, d)中的块是满足特定条件的序列集合{q, ti1, . .
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



