三种基因组的无基因家族中位数算法研究
1. 方法概述
在基因组分析领域,我们提出的方法与其他方法显著不同,其核心在于无家族原则,而其他方法通常需要事先进行基因家族分配。与MultiMSOAR相比,MultiMSOAR是唯一一种能处理两个以上基因组,并考虑基因顺序进化优化标准的方法。两者(针对三个基因组的MultiMSOAR和FF - median)都旨在计算最大权重的三方匹配。但我们的方法与MultiMSOAR有着根本区别,我们将序列和同线性保守性完全整合到目标函数中,而MultiMSOAR则先计算成对的直系同源分配来定义多部分图。
2. 算法和复杂度结果
- NP难度证明 :问题FF - Median被证明是MAX SNP难的,其硬度证明基于有界度为3的图的最大独立集问题的归约。
- 精确整数线性规划(ILP)算法 :
- 程序FF - Median利用问题FF - Median的特定属性,设计了一个使用$O(n^5)$个变量和语句的ILP算法,其中$n = max(|C(G)|, |C(H)|, |C(I)|)$。
- 该程序使用两种二进制变量$a$和$b$,变量$a$定义了中位数基因集合$\Sigma’$,表示候选基因在最优中位数$M$中的存在或缺失;变量$b$定义了候选保守中位数邻接集合$AC’$,指定两个基因末端或端粒之间的邻接是否在$M$中建立。
- 算法1给出了程序FF - Median的具体实现,其目标是最大化一个特定的目标函数,同时满足以下约束条件:
超级会员免费看
订阅专栏 解锁全文
1796

被折叠的 条评论
为什么被折叠?



