基于序列的基因簇一致性研究
1. 无符号邻接与一致性
在基因簇研究中,我们关注能否找到一个有效的基因顺序,使其包含给定的基因簇集合,并且满足基因多重性的限制,这就是所谓的一致性问题。对于无符号邻接的情况,如果满足特定条件,我们可以找到对应的欧拉路径,该路径对应一个基因序列,其中包含集合 ( C ) 中的所有邻接关系,且每个基因 ( g ) 恰好出现 ( m(g) ) 次,这就表明集合 ( C ) 相对于 ( m ) 是一致的。若不满足条件,就无法得到有效的基因顺序,一致性也就不成立。
2. 有符号邻接
2.1 有符号邻接的定义
有符号邻接模型考虑了基因的方向,这在基因共表达和基因顺序保守性方面具有重要作用。对于基因集合 ( GN = {1, \ldots, N} ),有符号邻接 ( {a, b} )(其中 ( a, b \in {g, -g | g \in GN} ))包含在序列 ( s ) 中,当且仅当在 ( s ) 中 ( a ) 直接跟随 ( -b ),或者 ( b ) 直接跟随 ( -a ) 至少一次。例如,对于 ( N = 4 ),有符号邻接 ( {2, -3} ) 同时包含在序列 ( s1 = (1, 2, 3, 4) ) 和 ( s2 = (4, 1, -3, -2) ) 中。
2.2 有符号基因顺序图
为了处理有符号邻接,我们调整了基因顺序图的定义。每个基因 ( g ) 在图中由两个节点表示,且每对节点之间通过 ( m(g) ) 条边连接。有符号基因顺序图 ( Gs_N(C) ) 的顶点集为 ( {vg, v - g | g \in GN} ),边集为 ( { {vg, v
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



