moon9
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
54、构建全局一致的通路参数估计
本文介绍了一种基于信念传播的全局一致生物通路参数估计算法。传统方法在处理大型通路模型时面临计算成本高、结果不一致等问题,而该方法通过将通路模型分解为组件并构建概率图模型,利用因子图和兼容性函数进行消息传递,实现了更高效、准确的参数估计。文章详细阐述了算法的步骤、优势与局限性,并通过实验验证其优于现有方法的表现,最后提出了未来的研究方向及操作流程总结。原创 2025-08-22 03:04:11 · 57 阅读 · 0 评论 -
53、生物信号转导网络推断与通路参数估计新方法
本博文介绍了生物信号转导网络推断与通路参数估计的新方法。重点探讨了两种信号转导网络推断方法的差异,以及其在不同网络场景下的性能表现。同时,提出了基于信念传播的参数估计方法,有效解决了大规模生物通路模型中组件重叠导致的参数冲突问题。此外,还详细解析了信念传播算法的具体实现步骤,并通过对比表格展示了不同方法的优缺点。最后,展望了这些新方法在药物研发、疾病诊断和系统生物学等领域的应用前景。原创 2025-08-21 09:42:36 · 46 阅读 · 0 评论 -
52、信号转导网络推理的新方法
本文提出了一种新的信号转导网络推理方法,通过整合间接因果效应并构建最稀疏的有向图,以保持所有可达性关系。该方法基于图论中的二元传递约简(BTR)和伪顶点合并(PVC)问题,能够在不依赖基因表达数据的情况下,有效合成一致的信号转导网络。实验结果表明,该方法在稀疏性、准确性和运行效率方面均优于传统方法,并在药物研发和疾病诊断等实际应用中展现出巨大潜力。未来的研究将聚焦于算法优化和多源生物信息的融合,以提升方法在大规模网络中的处理能力与适用范围。原创 2025-08-20 12:37:07 · 46 阅读 · 0 评论 -
51、高效准确构建遗传连锁图谱及信号转导网络推断新方法
本文介绍了高效准确构建遗传连锁图谱及信号转导网络推断的新方法。在遗传连锁图谱构建中,提出了基于最小生成树和期望最大化算法的MSTMAP方法,能够高效处理缺失数据和噪声数据,并在真实和模拟数据中验证了其优越性能。在信号转导网络推断中,提出了一种新方法,通过将因果关系表示为网络路径,并结合组合优化技术推断出最稀疏且与实验观察一致的网络结构。该方法为生物网络研究提供了新的思路和工具,具有良好的应用前景。原创 2025-08-19 16:10:10 · 81 阅读 · 0 评论 -
50、高效准确地从嘈杂和缺失的基因分型数据构建遗传连锁图谱
本文介绍了一种高效准确地从嘈杂和缺失的基因分型数据中构建遗传连锁图谱的新算法。通过理论分析和实验验证,该算法在数据质量高时能够利用最小生成树方法确定标记的真实顺序,并在处理噪声或缺失数据时表现出优于现有工具的准确性。算法结合了理论洞察和实用优化策略,为生物学研究提供可靠支持。原创 2025-08-18 16:30:47 · 95 阅读 · 0 评论 -
49、高效计算设计平铺阵列的方法与实践
本文探讨了在寡核苷酸平铺阵列设计中的多标准优化问题,重点解决如何选择满足熔解温度、探针质量和探针间距要求的探针组合,以最小化平铺路径的总成本。通过将问题转化为最短路径问题,并采用基于Dijkstra算法的高效实现,结合邻域限制和蒙日理论优化,实现了在大规模候选探针中快速找到最优解。文章还展示了该方法在结核分枝杆菌基因组设计中的应用,并提出了未来改进方向,如纳入非唯一探针和探索线性时间算法实现。原创 2025-08-17 12:24:40 · 40 阅读 · 0 评论 -
48、一维点放置问题与平铺阵列设计的高效算法
本博文探讨了一维点放置问题与基因组平铺阵列设计的高效算法。在一维点放置问题中,研究了通过不同轮数的成对距离查询来确定点在线上位置的策略,提出了两轮和三轮查询的上界算法,并分析了两轮查询的下界。同时,针对基因组平铺阵列设计问题,提出了一种新的多标准优化方法,将问题转化为最小成本平铺路径问题,并通过最短路径算法求解全局最优解。文章还对比了不同算法的复杂度和性能,并指出了未来的研究方向,包括匹配查询下界的策略、多轮查询的优化、非自适应算法的研究以及平铺阵列设计中考虑更多优化因素的拓展。原创 2025-08-16 14:04:04 · 40 阅读 · 0 评论 -
47、生物序列与点放置问题的研究进展
本文综述了生物信息学和计算生物学领域的三项重要研究成果。首先介绍了逆序列比对的最新进展,通过从部分示例中学习参数,显著提高了序列比对的准确性,特别是在使用绝对误差准则的情况下。其次,探讨了自闭症遗传学研究中的新方法,包括群体结构分析、全基因组关联分析和拷贝数变异检测,为自闭症易感性研究提供了新视角。最后,研究了直线上点放置问题的自适应版本,改进了不同轮次情况下的查询次数上下界,为DNA映射问题提供了更有效的解决方案。这些成果不仅具有重要的理论价值,也为生物医学和计算科学中的实际问题提供了新的方法和思路。原创 2025-08-15 16:48:54 · 33 阅读 · 0 评论 -
46、生物序列分析中的种子计算与逆序列比对技术
本博文深入探讨了生物序列分析中的两项关键技术:快速计算优质的多间隔种子和基于部分示例的逆序列比对方法。在多间隔种子方面,重点比较了不同种子在不同相似度水平下的敏感性,并讨论了其对同源性搜索效率的影响。在逆序列比对方面,详细介绍了如何通过线性规划和迭代方法,从部分示例中推导出最优的评分函数参数值。这些技术的结合有助于提高生物序列比对的准确性和搜索效率,为生物信息学研究提供了重要的理论支持和技术手段。原创 2025-08-14 14:54:41 · 53 阅读 · 0 评论 -
45、高效计算优质多间隔种子
本文深入探讨了生物信息学中多间隔种子的相关概念、重叠复杂度的计算方法以及多项式时间算法的应用。重点介绍了间隔种子的基本定义、种子匹配和敏感性的概念,并提出了一种高效的启发式算法——swap算法,用于快速计算具有低重叠复杂度的优质多间隔种子。通过与其他经典算法(如Yang算法、Kong算法)的比较,验证了该算法在效率和性能上的显著优势。文章还讨论了算法优化与拓展思路,如引入随机化策略、结合机器学习方法以及拓展到多序列比对场景。最后,结合实际应用案例(如基因测序数据分析、物种进化研究),展示了该算法在实际中的广原创 2025-08-13 10:22:34 · 32 阅读 · 0 评论 -
44、生物序列同源性搜索工具与策略解析
本文详细解析了生物序列同源性搜索中的关键工具与策略,重点介绍了fragrep2工具的应用特点及其在RNase MRP、Vault RNAs和Telomerase RNAs等RNA搜索中的实际案例。同时探讨了多重间隔种子策略的优势及其计算算法,包括简单启发式算法与结合灵敏度计算的改进方法。文章还分析了现有工具和策略的局限性,并展望了未来发展方向,旨在提升同源性搜索的准确性与效率。原创 2025-08-12 14:38:27 · 143 阅读 · 0 评论 -
43、利用碎片化核酸序列模式进行同源性搜索
本文介绍了一种利用碎片化核酸序列模式进行同源性搜索的方法,重点描述了新工具fragrep2的理论基础和应用。该工具基于位置特异性权重矩阵(PWM)和动态规划算法,允许插入和删除操作,从而更灵活地识别非编码RNA(ncRNA)的保守序列模式。文章详细阐述了fragrep2在RNase MRP和脊椎动物穹窿RNA同源序列搜索中的成功应用,并总结了其在处理序列多变性、评估匹配显著性以及组合模式搜索方面的优势。同时,文章展望了该方法在未来大规模基因组数据处理和ncRNA研究中的潜力。原创 2025-08-11 15:50:41 · 33 阅读 · 0 评论 -
42、HFold:高效预测RNA含假结二级结构的算法
本文介绍了一种高效预测RNA含假结二级结构的动态规划算法HFold。该算法基于分层折叠假设,能够处理包含亲吻发夹、H型假结和多假结等复杂结构的RNA序列。通过引入带边界函数和扩展的递推关系,HFold在预测结构时能有效结合已知的无假结结构信息,从而提升预测准确性。实验结果表明,当输入为真实无假结结构时,HFold的平均准确性达到85%以上,显著优于传统方法。未来的研究将聚焦于优化能量模型、改进输入结构以及与其他预测方法的全面比较。原创 2025-08-10 14:55:17 · 83 阅读 · 0 评论 -
41、RNA 折叠与假结结构预测:新算法与实验分析
本博文围绕RNA折叠与假结结构预测的新算法与实验分析展开,重点介绍了RNA交叉宽度的实验结果及其对参数化算法效率的影响,同时详细阐述了RNA二级结构预测的基本定义、能量模型以及密度-2结构的概念。文章提出了一种高效的假结结构预测算法——HFold算法,该算法基于分层折叠假设,能够在O(n³)时间复杂度内预测包含假结的RNA二级结构,尤其适用于处理嵌套接吻发夹等复杂结构。实验结果显示,当提供真实无假结子结构作为输入时,HFold算法能够显著提高预测准确性,但在输入无假结结构存在预测错误的情况下提升效果有限。研原创 2025-08-09 11:45:15 · 55 阅读 · 0 评论 -
40、基于图分解的RNA折叠算法优化
本博客介绍了一种基于图分解的RNA折叠算法优化方法。RNA折叠问题旨在寻找RNA序列的最低自由能二级结构,这可以转化为在茎图中寻找最大加权独立集的问题。传统的基于树分解的动态规划方法因茎图的树宽较大而效率不高。为此,本文提出了一种新的茎图特征描述方法,并开发了基于交叉宽度的参数化最优算法。通过引入交叉宽度的概念,该算法在稳定茎长度有界的情况下实现了时间复杂度为$O(2^{(2k^2 + 1)n}k^3n^2)$的优化性能。实验结果表明,茎图的交叉宽度通常较小,表明该算法在实际应用中具有较高的计算效率。未来的原创 2025-08-08 13:29:56 · 54 阅读 · 0 评论 -
39、特定 siRNA 选择与 RNA 折叠算法研究
本博文深入探讨了生物信息学中两个关键问题:特定siRNA选择与RNA折叠。针对特定siRNA选择问题,研究介绍了基于基数排序的SOS算法和基于哈希的SOS-Hash算法,以及考虑最长公共因子约束的扩展解决方案。这些方法在处理大规模mRNA数据时表现出优越的效率和适用性。对于RNA折叠问题,文章分析了现有方法,包括启发式算法、动态规划算法、基于图论模型的TdFOLD算法,以及一种基于交叉宽度参数的新算法。这些算法在预测RNA二级结构(尤其是包含假结的结构)方面各有优劣。最后,文章总结了这两个领域的发展现状,并原创 2025-08-07 15:02:06 · 47 阅读 · 0 评论 -
38、序列组装与 siRNA 选择的高效算法解析
本博文深入解析了序列组装与siRNA选择中的高效算法。在序列组装方面,探讨了图与超字符串的关系、双链DNA组装的中国邮递员问题建模以及双向德布鲁因图的应用,提出了基于双向流技术的多项式时间算法。针对siRNA选择问题,介绍了设计背景与挑战,对比了新旧算法的效率提升,并展示了基于排序和哈希技术的新解决方案。文章还总结了研究的关键知识点,并展望了未来的研究方向,包括组装模型优化、双向流技术拓展和siRNA算法改进等。原创 2025-08-06 13:20:09 · 47 阅读 · 0 评论 -
37、序列组装模型的可计算性
本文探讨了序列组装问题在图论模型中的可计算性,重点分析了字符串图和德布鲁因图模型的计算复杂度。通过归约方法,证明了在这两种模型下,序列组装问题均为NP难问题,这表明无法在多项式时间内找到最优解。此外,本文还提出了一种基于双向图模型的多项式时间算法,用于解决双链DNA的组装问题,结合中国邮递员问题的求解,实现了最短双链DNA序列的重建。研究成果为基因组组装领域提供了重要的理论支持和算法基础。原创 2025-08-05 13:21:49 · 69 阅读 · 0 评论 -
36、共线性模块提取算法:从区间图到基因组比较
本博客探讨了基因组研究中用于提取共线性模块的共线性模块提取算法,重点分析最大权重独立集(MWIS)问题的解决方案。从区间图的线性时间算法到通用图的改进分支限界算法,结合冲突图的分解和标记恢复技术,展示了算法在水稻和高粱基因组比较中的应用效果。文章深入解析了算法原理、技术细节及实际操作步骤,并展望了未来的研究方向,为基因组研究提供了有效的分析工具。原创 2025-08-04 11:23:27 · 96 阅读 · 0 评论 -
35、高效算法:探索构象空间与提取同线性模块
本文介绍了两种高效算法在生物信息学中的应用:探索蛋白质构象空间与从比较基因组图谱中提取同线性模块。第一部分探讨了种子采样算法和变形采样算法如何用于蛋白质构象空间的无冲突采样,第二部分详细描述了如何通过构建预条带和解决最大权重独立集(MWIS)问题,准确识别基因组间的同线性模块。文章还展示了这些算法在水稻和高粱基因组比较中的实际应用,为基因组进化研究提供了重要支持。原创 2025-08-03 14:21:20 · 84 阅读 · 0 评论 -
34、高效探索柔性蛋白质环构象空间的算法
本文介绍了一种高效探索柔性蛋白质环构象空间的算法,通过种子采样和变形采样两种技术,同时满足运动学闭合和避免空间位阻冲突的约束条件。种子采样能够在闭合无冲突构象空间中广泛生成构象,而变形采样则可以对“有趣”区域进行更密集的探索。实验结果表明,这两种方法在不同大小和受限程度的蛋白质环上均表现出色,运行时间在可接受范围内。相关算法已集成到工具包LoopTK中,可在https://simtk.org/home/looptk获取。原创 2025-08-02 13:24:59 · 60 阅读 · 0 评论 -
33、基于时态逻辑模型检查预测蛋白质折叠动力学
本文介绍了一种基于时态逻辑模型检查预测蛋白质折叠动力学的新方法。通过使用Kripke结构和CTL(计算树逻辑)对蛋白质折叠的能量景观进行建模和验证,能够处理极大状态空间,并提供精确的折叠速率预测。实验结果表明,该方法在预测折叠速率方面与实验测量值具有较高的相关性(相关系数0.87),优于传统方法。此外,研究还比较了精确模型检查与近似模型检查的效率与适用性,并展望了未来在时态逻辑查询探索、算法结果分析以及随机行为模型应用方面的研究方向。原创 2025-08-01 10:47:27 · 55 阅读 · 0 评论 -
32、生物序列分析与蛋白质折叠动力学预测方法探索
本文探讨了生物信息学领域中两种重要的研究方法:在线维特比算法在长生物序列分析中的应用,以及基于模型检查技术预测蛋白质折叠动力学的新方法。在线维特比算法通过优化内存使用,显著提高了对长生物序列的处理能力,适用于基因分析和序列比对等场景;而基于模型检查技术的方法通过符号编码和时态逻辑公式,实现了对蛋白质折叠动力学的精确预测,为蛋白质结构与功能研究提供了新的工具。文章还分析了两种方法的综合优势,并展望了未来在算法优化、跨学科融合和实验验证方面的研究方向。原创 2025-07-31 11:34:24 · 38 阅读 · 0 评论 -
31、长生物序列分析的在线维特比算法
本文介绍了一种用于长生物序列分析的在线维特比算法,该算法通过动态调整内存使用,显著降低了传统维特比算法的内存需求。文章从理论和实验两个角度分析了算法在双状态HMM和多状态HMM中的表现,证明了其在处理长序列时的高效性和适用性。对于双状态HMM,理论上证明了内存需求为Θ(m log n),而对于多状态HMM,虽然理论分析较为复杂,但实验结果表明其内存增长近似于对数或受c log²n限制。该算法适用于基因查找等生物信息学任务,并具备在线处理能力。原创 2025-07-30 14:19:49 · 47 阅读 · 0 评论 -
30、支持向量机序列分类器的快速核方法与在线维特比算法
本文介绍了支持向量机序列分类器的快速核方法与在线维特比算法在生物序列分析中的应用。快速核方法通过特征选择和算法优化,显著提高了分类性能和计算速度,适用于DNA条形码分类和蛋白质序列分析等场景。在线维特比算法有效降低了传统维特比算法的内存需求,使得长基因组序列的实时注释成为可能。文章还探讨了这些方法在多组学数据融合和深度学习结合中的未来发展趋势,并分析了数据质量、算法复杂度和模型解释性等方面的挑战。原创 2025-07-29 09:19:24 · 40 阅读 · 0 评论 -
29、生物序列分析中的基因组特征与快速核方法
本文探讨了生物序列分析中基因组特征和快速核方法的应用。重点介绍了θdbc特征在物种起源和进化分析中的优势,以及支持向量机(SVM)中字符串核方法的高效实现,包括计数排序形式、分治算法和带特征选择的核方法。这些方法显著提高了物种识别的计算效率和分类准确率,为生物信息学提供了有效的工具。原创 2025-07-28 11:53:01 · 43 阅读 · 0 评论 -
28、德布鲁因链中的基因组特征研究
本博文研究了一种基于德布鲁因链(DBC)和DNA单词图(DWG)的新型基因组特征,用于高效区分不同基因组并预测短DNA序列的来源。该特征结合了顶点删除频率和马尔可夫链平稳分布,通过MATCH算法实现未知序列的分类。实验表明,该方法在区分不同物种及密切相关基因组方面表现出色,尤其适用于短至几Kb的序列,优于传统的二核苷酸优势比(θdor)方法。原创 2025-07-27 13:52:56 · 89 阅读 · 0 评论 -
27、利用蛋白质结构域提高从头基因预测的准确性
本文介绍了一种通过整合蛋白质结构域同源性信息来提高从头基因预测准确性的方法。基于GlimmerHMM工具,研究者将Pfam和HMMER生成的蛋白质结构域信息引入广义隐马尔可夫模型(GHMM)框架中,从而开发出GlimmerHMM+。实验结果表明,这种方法在拟南芥和斑马鱼数据集的基因预测中提高了灵敏度与特异性,尤其在新基因发现、基因组注释和药物研发方面具有广泛应用潜力。原创 2025-07-26 16:33:45 · 67 阅读 · 0 评论 -
26、最优RMSD的定义与计算
本文深入探讨了最优RMSD(均方根偏差)及其加权形式wRMSD在多结构对齐中的应用。通过数学定理推导和算法设计,详细分析了如何通过旋转和平移操作最小化wRMSD,并提出了一个高效迭代算法来实现结构对齐。文章还介绍了如何利用wRMSD查找结构保守区域,克服传统RMSD对异常值敏感的问题。实验结果显示该算法具有良好的收敛性和稳定性,适用于蛋白质家族的结构对齐和功能分析。原创 2025-07-25 10:41:24 · 160 阅读 · 0 评论 -
25、蛋白质结构预测与比对算法研究进展
本文综述了蛋白质结构预测与比对算法的研究进展,重点介绍了广义模式搜索(GPS)和网格自适应直接搜索(MADS)在蛋白质结构预测中的应用,探讨了基于投影的无比对局部结构搜索方法以及多结构比对中加权均方根偏差(wRMSD)的计算方法。文章分析了这些算法的优势与局限性,并提出了未来研究的方向,包括算法优化、多目标优化、与机器学习结合以及应用拓展等方面,旨在推动生物信息学领域的发展。原创 2025-07-24 14:14:58 · 67 阅读 · 0 评论 -
24、蛋白质结构预测:拓扑独立对齐与模式搜索算法
本博客介绍了两种关键的蛋白质结构研究方法:拓扑独立的蛋白质结构对齐方法和基于广义模式搜索(GPS)与网格自适应直接搜索(MADS)算法的蛋白质结构预测方法。拓扑独立对齐方法有助于发现蛋白质结构相似性,而GPS与MADS算法为高效预测蛋白质三维结构提供了新的解决方案。研究通过实验分析了不同蛋白质的预测效果以及算法性能的影响因素,并提出了未来的研究方向。原创 2025-07-23 12:31:34 · 56 阅读 · 0 评论 -
23、拓扑独立的蛋白质结构比对
本文介绍了一种新的拓扑独立的蛋白质结构比对算法,该算法在比对残基数量、相似度评分和运行效率方面均有显著改进。通过引入基于局部比率方法的近似算法和新的评分体系,该方法能够更准确、可靠地识别蛋白质结构的相似性,并评估其统计显著性。研究发现了多个新的环状置换和非环状置换蛋白质对,展示了算法在蛋白质功能、进化和药物研发等领域的广泛应用前景。原创 2025-07-22 13:30:42 · 54 阅读 · 0 评论 -
22、蛋白质家族中的信息基序与拓扑无关的蛋白质结构比对
本博客介绍两种生物信息学领域的创新算法。第一种是对Apriori算法的改进,用于挖掘蛋白质家族比对中的信息基序,能够识别具有高信息含量且不在家族共识范围内的残基基序,揭示蛋白质家族的局部保守特征和交替偏好。第二种是基于近似算法的拓扑无关蛋白质结构比对方法,通过片段化蛋白质并计算相似度得分,将结构比对问题转化为最大权重独立集问题,能够有效识别包括循环排列在内的非顺序结构相似性。两种方法分别提升了对蛋白质家族特征分析和结构比对的灵敏度和适用范围,为蛋白质功能预测、结构分类及进化研究提供了有力工具。原创 2025-07-21 14:51:20 · 64 阅读 · 0 评论 -
21、生物序列基序识别算法研究与分析
本文介绍了两种生物序列基序识别方法:MCL-WMR算法和基于信息论的非共识基序检测方法。MCL-WMR利用图聚类技术在复杂数据中识别弱基序,表现出高准确性和处理挑战性问题的能力;基于信息论的方法则聚焦于挖掘蛋白质家族比对中非共识的局部偏好,为理解蛋白质功能和多样性提供了新视角。两种方法各有优势,相互补充,为生物信息学研究提供了全面的解决方案。原创 2025-07-20 09:34:33 · 86 阅读 · 0 评论 -
20、弱基序识别的算法与图聚类方法
本文介绍了弱基序识别的两种主要方法:冗余基序基础的增量发现算法和基于图聚类的MCL-WMR方法。增量发现算法通过两个阶段在O(|Σ|n² log n)时间内计算非冗余基序基础,而MCL-WMR则通过加权图模型和MCL聚类算法在多项式时间内识别弱基序。文章还分析了算法的理论基础、实验性能以及在实际生物数据中的应用,并探讨了算法的改进方向。原创 2025-07-19 10:52:06 · 46 阅读 · 0 评论 -
19、时间复杂度为 O(|Σ|n² log n) 的非冗余基序基的增量发现
本文介绍了一种时间复杂度为 O(|Σ|n² log n) 的增量算法,用于发现输入字符串所有后缀的非冗余基序基。该算法通过预处理统计通配符数量及谱系信息,结合最早索引计算和排箫数据结构的维护,高效管理基序的出现位置。算法分为两个主要阶段:第一阶段从已有基中提取在当前后缀中仍然非冗余的基序,第二阶段识别并筛选出新的非冗余基序。整个过程利用字符串的自相关结构和动态数据管理,显著降低了计算复杂度,适用于大规模字符串数据的模式挖掘任务。原创 2025-07-18 13:20:30 · 38 阅读 · 0 评论 -
18、生物序列分析中算法的加速与优化
本文介绍了生物序列分析中两个重要问题的算法优化与改进。一是TBR启发式算法的加速,通过改进算法步骤显著降低了时间复杂度,使得大规模系统发育分析更加高效;二是冗余基序的增量提取算法,相较之前的方法在时间复杂度上实现了显著提升,并通过相关性质和判定引理进一步优化了基序提取过程。这些改进为生物信息学的发展提供了更高效的工具支持。原创 2025-07-17 14:39:34 · 43 阅读 · 0 评论 -
17、实现 TBR 启发式算法 Ω(n²/ log n) 加速
本文深入探讨了如何将TBR(Tree Bisection and Reconnection)启发式算法的效率提升至接近SPR(Subtree Prune and Regraft)启发式算法的水平,实现了Ω(n²/ log n)的加速。通过对TBR和SPR邻域得分的关联分析,定义并解决BestRooting(BR)问题,设计了高效的Alg-RCT算法来解决Rooting问题,并将其融入整体TBR-S问题的求解框架。最终在不依赖基因树和物种树大小相似假设的前提下,显著提升了TBR启发式算法在大规模系统发育分析中原创 2025-07-16 11:11:46 · 59 阅读 · 0 评论 -
16、基于最小进化准则推断重排与重组模型及基因复制问题启发式算法加速
本博客介绍了基于最小进化(ME)准则推断基因组重排、重组及水平基因转移事件的方法,并探讨了对基因复制问题的TBR启发式算法的改进。通过逐步增加网状边并分析ME得分变化,该方法能够有效推断进化过程中的复杂事件,且在细菌、植物和病毒数据中均表现出良好的准确性和鲁棒性。此外,改进的TBR启发式算法显著降低了时间复杂度,为大规模系统发育分析提供了更高效的工具。未来的研究方向包括扩展进化操作集、开发病毒进化模拟器及进一步优化相关算法性能。原创 2025-07-15 10:23:25 · 50 阅读 · 0 评论 -
15、基于最小进化准则推断重排和重组模型
本文介绍了一种基于最小进化准则推断生物序列重排和重组的模型方法。该方法通过将基因组划分为非重叠的d-同源子序列家族,并利用网状边描述其进化历史,结合系统发育网络和距离度量优化最小进化得分。文章分析了问题的计算复杂度,将其分解为多个NP难子问题,并提出了启发式算法的三阶段解决方案:生成序列对的良好划分、扩展划分为非重叠家族、添加网状边并调整子序列边界。方法适用于不同输入假设下的问题变体(NRGT、RGT、RNT),为研究生物序列的复杂进化提供了有效工具。原创 2025-07-14 15:13:53 · 31 阅读 · 0 评论
分享