无符号易位排序的新近似算法
1 引言
基因组重排解释了基因组中基因顺序变化的原因,可形式化为反转、易位、转座等基本操作。基因组重排排序问题旨在找到将一个基因组转换为另一个基因组的最短重排序列,这有助于追溯基因组间的进化路径。
1.1 反转排序相关情况
- 对于有符号线性基因组,反转排序可在多项式时间内解决。后续工作改进了算法的运行时间并简化了底层理论。
- 而对于无符号线性基因组,反转排序是 NP 难问题,但可近似到性能比为 1.375。
1.2 易位排序相关情况
- 有符号易位排序方面,最初的算法时间复杂度为 $O(n^3)$,之后有多个改进算法不断降低时间复杂度,目前最快的算法时间复杂度为 $O(n^{\frac{3}{2}}\sqrt{\log n})$ 。
- 无符号易位排序是 NP 难和 Max - SNP 难问题。过往算法的性能比不断得到改进,从最初的 2 改进到 1.75、$1.5 + \epsilon$ ,最近的算法能达到 $1.408 + \epsilon$ 。
本文提出了一种新的无符号易位排序近似算法,能在多项式时间内达到 1.375 的性能比。该算法通过将关于两个无符号基因组的断点图分解为一组交替循环来近似无符号易位排序,等价于为无符号基因组中的基因分配符号。具体步骤为:先将断点图分解为一组不相连的组件,使每个组件能单独分解为交替循环;再将每个组件分解为足够多的循环,以将无符号易位排序近似到 1.375 的性能比。
无符号易位排序新近似算法
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



