快速系统发育兼容性测试与无基因家族的三个基因组中位数问题解析
1. 快速系统发育兼容性测试中的BuildNT算法
在快速系统发育兼容性测试中,BuildNT算法是一个关键部分。该算法主要处理两个核心方面:一是在第1行查找半通用标签,二是在第6和第7行更新U和HP(U)。
为了高效处理图的边和节点删除操作,采用了Holm等人提出的动态图连通性数据结构(HDT)来表示图HP。HDT能够维护每个连通分量中的节点列表以及节点数量,从一个有N个节点且无初始边的图开始,每次更新的摊还成本为O(log²N)。由于HP有O(MP)个节点,所以每次更新需要O(log²MP)时间。BuildNT(Uroot)执行的边和节点删除总数最多为HP中的边和节点总数,即O(MP),这使得整个算法能在O(MP log²MP)时间内维护连通性信息。
在算法执行过程中,BuildNT为每个创建的连通分量Y维护三个数据字段:Y.weight、Y.map和Y.semiU,同时为每个标签ℓ∈L(P)维护一个字段ℓ.count。具体如下:
- Y.weight :等于∑(ℓ∈Y) kℓ。
- Y.map :是一个从集合JY⊆[k]到Y∩L(Ti)的非空子集的映射。对于每个i∈JY,Y.map(i)表示与之关联的集合。
- ℓ.count :等于集合{i∈[k] : Y.map(i)已定义且Y.map(i) = {ℓ}}的基数。
- Y.semiU :是一个包含Y中所有满足ℓ.count = kℓ的标签ℓ的集合。
在
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



