EGG99
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
56、编码最近更大值与基因组重排问题研究
本文研究了受限最近更大值问题(RNNLV)与基因组重排中的SCJD距离计算。在RNNLV中,通过构造数组块结构推导出NNLV解数量的下界;在基因组重排中,提出允许切割、连接和全染色体复制的SCJD模型,给出了计算SCJD距离的线性时间算法,并证明最少复制次数的最优序列问题是NP难的。研究为相关领域提供了理论基础与实用工具,未来可拓展至后缀树压缩与真实生物数据应用。原创 2025-10-22 10:13:08 · 31 阅读 · 0 评论 -
55、最近更大值编码:高效空间利用与查询支持
本文提出了一种高效处理数组中最近更大值(NNLV)问题的编码方法。通过构建笛卡尔树并进行路径压缩与有损编码,实现了在1.9n + o(n)位空间内存储所有查询答案,并支持O(1)时间响应查询。同时证明了该问题的空间下界为至少1.3173n - Θ(1)位。方法结合树分解与指纹存储,显著提升了大规模数据下的空间利用率和查询效率,适用于数据库优化、数据挖掘等场景。原创 2025-10-21 13:27:33 · 28 阅读 · 0 评论 -
54、缩减率的概率分析与最近较大值编码问题研究
本文研究了随机单词中LMS因子数量的缩减率概率分析与最近较大值(NLV)编码问题。基于马尔可夫链理论,建立了无记忆源和马尔可夫源下缩减率的数学模型,推导出期望缩减率的收敛值γ_p,并通过实验验证了在真实数据(如人类染色体22)上一阶马尔可夫链模型的准确性。同时,深入探讨了NNLV问题的组合复杂性,分析了不同平局打破规则对空间界限的影响,并提出一种高效的二叉树路径压缩表示方法,可在1.9n + o(n)位内编码并支持O(1)查询。研究为IS算法性能分析及空间高效数据结构设计提供了理论基础,未来可拓展至高阶模型原创 2025-10-20 09:01:06 · 24 阅读 · 0 评论 -
53、字符串处理算法:连续子串出现报告与后缀数组IS算法的概率分析
本文探讨了两个重要的字符串处理问题:连续子串出现报告与后缀数组IS算法的概率分析。针对在文本中寻找模式紧密出现对的问题,提出了一种基于后缀树路径和一维范围报告的数据结构,实现O(n log n)空间与最优O(p + k)查询时间的平衡。同时,对IS算法在不同随机源(均匀、无记忆、马尔可夫)下的行为进行了深入的概率分析,建立了LMS因子数量的马尔可夫链模型,并推导出典型缩减比率的理论公式,通过实验验证了其准确性。研究为字符串算法的设计与性能预测提供了理论支持,并展望了其在模式挖掘与文档检索等场景的扩展潜力。原创 2025-10-19 14:04:16 · 26 阅读 · 0 评论 -
52、短模式半动态紧凑索引与连续子串出现报告
本文介绍了一种用于短模式的半动态紧凑索引算法,以及在有界间隙约束下报告连续子串出现的高效方法。该索引算法可在O(n)时间内构建,并具有紧凑的空间占用,适用于长文本处理。另一种方法通过将字符串查询问题转化为几何中的正交线段相交问题,结合后缀树与重路径分解,实现了O(p + k)的最优查询时间,特别适用于计算生物学中的DNA序列分析、tRNA结构识别等场景。实验结果表明,该索引在构建速度和查询效率上优于多种传统索引结构。原创 2025-10-18 16:25:01 · 22 阅读 · 0 评论 -
51、短模式的半动态紧凑索引
本文介绍了一种用于短模式的半动态紧凑索引的数据结构与算法,结合b叉树与van Emde Boas树技术,支持高效的lookup、successor和insert操作。通过构建vEBb树和q元组转移图,实现对短模式在大规模文本中的快速搜索,时间复杂度为O(k × occ + log_σ n)。该方法在生物信息学、文本检索和网络安全等领域具有广泛应用潜力,兼顾时间效率与空间紧凑性。原创 2025-10-17 13:36:30 · 20 阅读 · 0 评论 -
50、关于最大无边界因子及相关索引技术的研究
本文研究了字符串处理中的最大无边界因子(MUF)及其相关索引技术。理论方面,推导出MUF的期望长度下界,并提出改进算法,显著提升计算效率;实践方面,设计了一种紧凑半动态文本索引,支持高效短模式查询与文本末尾动态更新,同时提出一种简洁的van Emde Boas树,实现接近最优时间复杂度的前驱/后继操作。实验验证了算法和索引在不同字母表下的性能优势,未来可拓展至生物信息学、自然语言处理等领域,并结合机器学习与并行计算进一步优化。原创 2025-10-16 11:31:41 · 23 阅读 · 0 评论 -
49、关于最大无边界因子的研究
本文深入研究了字符串中最大无边界因子(MUF)的性质与计算方法,探讨了其与字符串长度和最小周期的关系。回顾了Ehrenfeucht、Silberger、Assous、Pouzet及Holub等人的经典结果,并介绍了生成具有大MUF字符串的方法。基于无边界字符串的数量下界,证明了最大无边界因子的期望长度至少为 $n(1 - \xi(\sigma) \cdot \sigma^{-4}) + O(1)$,在 $\sigma \geq 5$ 时接近 $0.99n$。提出并优化了计算MUF的算法,时间复杂度由 $O(原创 2025-10-15 16:18:36 · 19 阅读 · 0 评论 -
48、并行外部内存后缀排序算法详解
本文详细介绍了并行外部内存后缀排序算法pSAscan的设计与实现。该算法结合了并行计算与外部内存处理技术,通过分块构建后缀数组、并行化反向搜索和间隙数组更新优化,在大规模数据处理中实现了高效的时间、空间与I/O性能。文章阐述了算法的并行合并策略、块大小选择、磁盘使用优化,并展示了在不同平台和数据集上的实验结果,表明pSAscan在多数场景下优于现有算法,尤其在大文件处理中表现突出。同时分析了其在特定输入下的局限性,并提出了未来在算法拓展、优化及多场景适应方面的研究方向。原创 2025-10-14 09:12:41 · 26 阅读 · 0 评论 -
47、并行外部内存后缀排序:高效算法与优化策略
本文提出了一种高效的并行外部内存后缀排序算法pSAscan,通过改进SAscan的核心步骤并引入并行化策略,显著提升了大规模数据下后缀数组构建的速度与空间效率。算法优化了BWT和位向量的计算、采用二分搜索加速反向搜索起始位置确定,并实现几乎原地的SA合并,仅需7.5n字节磁盘空间。实验表明,pSAscan比现有方法快四倍以上,成功处理1TiB文本数据,具有优异的可扩展性,适用于生物信息学和大规模文本索引等应用场景。原创 2025-10-13 13:12:47 · 21 阅读 · 0 评论 -
46、不可约LCP值之和的更紧界
本文深入探讨了不可约最长公共前缀(LCP)值之和的上下界问题,通过左极大LAR与分散对的关系建立了理论基础。推导出在一般情况下的n lg n上界以及给定BWT游程数r时的更紧n lg r上界,并通过德布鲁因集合等构造方法证明了这些界的紧性。文章还给出了匹配上下界的显式构造,涵盖了单词集合与单个单词的情形,为字符串压缩与索引结构的性能分析提供了精确的理论支撑。原创 2025-10-12 11:32:17 · 22 阅读 · 0 评论 -
45、字符串处理中的贪心猜想与LCP值和的更紧界
本文探讨了字符串处理中的两个重要问题:最短公共超串问题的贪心猜想及其在长度为4字符串下的证明,以及不可约LCP值和的更紧界研究。通过引入循环后缀、BWT游程、左最大LAR和分散对等概念,将不可约LCP值和的上界从O(n lg n)改进为n lg r + O(n),其中r为BWT游程数,并验证了该界的紧性。研究成果显著优化了LCP数组构造算法的时间复杂度,尤其适用于高重复性文本处理,为后续字符串算法设计与分析提供了理论基础和应用方向。原创 2025-10-11 10:03:49 · 22 阅读 · 0 评论 -
44、长度为4的字符串贪心猜想证明
本文证明了在输入字符串长度为4的特殊情况下,最短公共超串(SCS)问题中的贪心猜想成立,即贪心算法具有2的近似比。通过引入重叠、压缩、好块与坏块等概念,并对长度为5的坏块进行深入分析,结合多个关键引理和推论,最终完成了主要定理的证明,为该NP难问题在特定条件下的性能提供了理论支持。原创 2025-10-10 09:23:53 · 23 阅读 · 0 评论 -
43、在线重复检测与回溯算法详解
本文详细介绍了针对无序字母表和有序字母表的在线重复检测算法,涵盖无回溯与带回溯两种策略。通过引入捕获器机制,算法能高效检测字符串中的e-重复模式。对无序字母表,采用分段覆盖策略实现O(n log m)时间复杂度;对有序字母表,结合最短唯一后缀信息,在线计算t_i序列,达到O(n log σ)时间复杂度和线性空间。文章还分析了算法复杂度、应用场景及优化方向,并提供了流程图与对比表格,展示了其在文本处理和生物信息学等领域的重要应用价值。原创 2025-10-09 15:38:31 · 26 阅读 · 0 评论 -
42、字符串幂与树中的重复检测算法
本文深入探讨了字符串幂在树结构中的性质及相关重复检测算法。介绍了多个关键定理,如不同指数区间下幂的数量渐近界,以及有根树中立方体数量的线性上界。提出了两种在线重复检测算法:一种支持回溯操作,适用于需要撤销输入的场景;另一种适用于有序字母表且内存占用低。核心数据结构Catcher基于周期性匹配原理实现高效检测,并通过流程图清晰展示了算法工作流程。文章还分析了各算法的复杂度与适用场景,给出了具体应用示例,并指出了未来研究方向,如α∈[3,4)时的精确界问题,具有重要的理论与实践价值。原创 2025-10-08 09:10:39 · 20 阅读 · 0 评论 -
41、最大有根三元组一致性与树中字符串幂的研究
本文探讨了最大有根三元组一致性(MTC)问题与树中字符串幂的组合数学研究。在MTC方面,介绍了定理5的求解方法、加权情况下的推广及开放问题;在树中字符串幂方面,分析了不同α值下powers_α(n)的渐近行为,揭示了相变阈值现象,并深入研究了有根树中立方的分解类型与数量界限。研究成果对生物信息学中的系统发育树构建和组合数学中的重复结构理论具有重要意义,并具备在数据压缩、模式识别等领域的应用潜力。原创 2025-10-07 12:34:34 · 28 阅读 · 0 评论 -
40、最大有根三元组一致性问题的近似算法研究
本文研究了最大有根三元组一致性问题(MTC)的近似算法,提出了多项式时间的1/4-近似算法,并针对稠密实例设计了基于平滑多项式整数规划的PTAS。此外,扩展了Wu的精确算法,构建了适用于MTC的指数时间近似方案(ETAS),并详细阐述了算法在加权情况下的适配方法。文章涵盖了未加权与加权情形下的理论分析、算法流程及复杂度评估,为系统发育树构建提供了多种有效的近似求解方案,对生物信息学等相关领域具有重要意义。原创 2025-10-06 16:00:44 · 21 阅读 · 0 评论 -
39、可堆序列划分、堆表格与多重集扩展及最大有根三元组一致性问题研究
本文探讨了组合数学与生物信息学中的两个重要研究方向:可堆序列划分与堆表格、以及最大有根三元组一致性问题。在可堆序列方面,研究聚焦于HADk过程的结构收敛性、堆表格的推广定义及其与杨氏表格的关系,并提出了多重集扩展和钩子不等式的应用前景;在生物信息学方面,重点分析了MTC问题的复杂度、近似算法(如1/4-近似、PTAS、ETAS)及精确算法进展,总结了MRTC与MMRTC等问题的研究现状。文章还指出了多个开放问题,包括猜想1的严格证明、HADk过程的深入分析、堆表格钩子公式的构建、以及高效算法在实际数据中的应原创 2025-10-05 15:30:47 · 31 阅读 · 0 评论 -
38、字符串匹配与序列划分相关研究
本文研究了字符串匹配与整数序列划分中的关键问题。在字典匹配方面,提出基于失败树质心路径分解的空间优化方法,将空间复杂度降至 $O(n \log n)$。在序列划分方面,引入 $k$-可堆序列概念,设计基于堆森林签名与支配关系的贪心算法计算 $MHS_k(X)$,并建立其与多集 Hammersley 过程的期望等价性。进一步提出堆表概念,扩展 Robinson-Schensted 对应并证明相关钩子不等式。最后指出多间隙字典匹配与文本间隙变体的简洁解法为未来研究方向。原创 2025-10-04 15:07:28 · 23 阅读 · 0 评论 -
37、不均匀间隙的字典匹配
本文提出了一种基于后缀树和3D矩形穿刺问题的高效字典匹配框架,用于解决模式中存在不均匀间隙的匹配难题。通过构建正向与反向后缀树,并将模式映射为三维矩形,将匹配过程转化为点对矩形的穿刺查询,显著提升了查询效率。文章还探讨了长/短模式分离、多种间隙变体处理以及不同空间-时间权衡策略,支持在复杂场景下优化性能,为文本处理中的灵活模式匹配提供了新思路。原创 2025-10-03 09:58:17 · 18 阅读 · 0 评论 -
36、组合RNA设计与字典匹配问题研究
本文探讨了组合RNA设计与字典匹配问题的研究进展。在组合RNA设计方面,介绍了结构转换定理及其证明过程,总结了可设计结构的特征描述与现有成果,并指出计算复杂性与模型扩展是未来挑战。在字典匹配方面,研究了包含不均匀间隙的单间隙模式匹配问题,提出了多种索引方法,在不同空间与时间复杂度之间实现权衡,并推广至多间隙及文本中产生间隙的情形。两个领域均展现了算法设计中的优化思想,且面临复杂性与实际应用的平衡问题,未来可在更真实模型和广泛应用场景下进一步探索。原创 2025-10-02 09:19:54 · 22 阅读 · 0 评论 -
35、组合RNA设计:可设计性与结构近似算法
本文研究了组合RNA设计中的可设计性问题,基于简化能量模型分析了不同字母表下RNA二级结构的可设计条件。通过引入树表示法、适当着色与分离着色等概念,给出了在受限和完整字母表上可设计结构的充分或必要条件,并证明了相关定理。针对非可设计结构,提出了一种时间复杂度为Θ(n)的结构近似算法,可通过膨胀操作将其转化为可设计结构。文章还探讨了k-重复操作下的封闭性性质,并提供了算法流程与实例说明,为RNA分子的设计提供了理论基础与实用工具。原创 2025-10-01 13:14:11 · 32 阅读 · 0 评论 -
34、LZD 因式分解:简单实用的在线语法压缩
本文介绍了一种简单实用的在线LZD因式分解算法,利用后缀树在O(N log σ)时间内完成语法压缩。通过扩展为可变到固定编码(LZDVF),结合计数器和前缀替换策略,有效提升大规模高度重复数据的压缩效率。实验表明,该方法在压缩比和速度上优于现有算法,尤其适用于内存受限场景下的大数据处理。原创 2025-09-30 12:46:18 · 35 阅读 · 0 评论 -
33、高效文本检索与压缩技术:Top-k 检索与 LZD 分解
本文介绍了高效的文本检索与压缩技术,重点探讨了灵活的Top-k检索紧凑索引和基于LZ78改进的LZD分解算法。在检索方面,基于自索引的框架支持复杂评分函数下的多词查询;在压缩方面,LZD分解通过将因子定义为两个最长先前因子的连接,在压缩比、运行时间和空间效率上优于现有方法。实验表明,LZD分解在基因组数据、版本控制历史等高度重复的大规模文本中表现优异,具有良好的应用前景。原创 2025-09-29 14:53:43 · 24 阅读 · 0 评论 -
32、灵活的Top-k检索紧凑索引技术解析
本文提出了一种灵活的基于自索引的Top-k文档检索框架,支持复杂相似度度量下的多词项查询高效处理。通过泛化GREEDY算法,并引入文档长度重排序与基于重复数组R的改进词频估计技术,显著减少了评估节点数量。结合小波树与二进制后缀树等紧凑数据结构,在TB级数据集上实现了高效、节省空间的排名安全检索。实验表明,该方法在支持多种IR模型(如BM25、TF×IDF)的同时,优于传统倒排索引,尤其适用于多词表达式和动态评分函数场景。原创 2025-09-28 11:12:14 · 25 阅读 · 0 评论 -
31、区间最大和段查询编码及其应用
本文深入探讨了区间最大和段查询(RMaxSSQ)问题的高效解决方案,包括使用Θ(n)字空间实现常数时间查询的算法设计,并进一步将空间优化至Θ(n)位。通过构建候选图与左兄弟图,避免显式存储大数组,提升了空间效率。文章还展示了该技术在计算最大k-覆盖问题中的应用,利用转换树和预处理策略,实现了O(n)预处理时间和O(k)查询时间的最优性能,显著优于传统方法,尤其适用于多k值场景。原创 2025-09-27 16:09:25 · 24 阅读 · 0 评论 -
30、字符串模式匹配与范围最大和段查询研究
本文研究了字符串模式匹配与范围最大和段查询两个核心问题。在字符串模式匹配方面,提出了基于全文索引的高效算法,支持最优时间内的非重叠出现位置查找及范围报告。在范围最大和段查询方面,设计了一个仅占用12n + o(n)位的空间优化数据结构,可在常数时间内返回最大和段索引,并证明了该问题的空间下界为至少1.89113n - Θ(lg n)位。此外,提出该数据结构在k覆盖问题中的新应用,实现O(n)预处理后对任意k在O(k)时间内求解,优于已有方法。研究成果在文本处理、生物信息学等领域具有广泛应用前景。原创 2025-09-26 15:13:01 · 25 阅读 · 0 评论 -
29、简洁非重叠索引技术解析
本文深入探讨了简洁非重叠索引技术,介绍如何在文本中高效查找模式的非重叠出现。基于后缀树、后缀数组和压缩后缀数组等数据结构,结合二维与一维范围报告方法,针对长模式(|P| > log log n)和短模式(|P| ≤ log log n)分别设计算法,在O(|P| + nocca,b)时间内完成查询。文章详细阐述了关键出现、模式周期等核心概念,并通过引理和观察分析了算法正确性与复杂度。该技术广泛应用于信息提取、频繁模式挖掘等领域,具备良好的理论价值与应用前景。原创 2025-09-25 14:41:05 · 22 阅读 · 0 评论 -
28、小空间下的Lempel Ziv计算与简洁非重叠索引
本文探讨了在小空间环境下LZ78分解的高效计算方法,通过引入上界分析与边分类策略,将LZ78字典树的空间消耗优化至\(\epsilon n \lg n + o(n)\)位。同时,研究了简洁的非重叠索引问题,提出基于全文本索引(如CSA)的新解决方案,无需额外数据结构即可实现灵活的时空权衡,在查询时间与空间效率上优于或等同于已有方案。文章还对比了不同索引方法及范围非重叠索引的现有成果,并展望了未来在空间优化、查询效率提升和应用拓展方面的研究方向。原创 2025-09-24 14:24:06 · 22 阅读 · 0 评论 -
27、小空间下的 Lempel Ziv 计算(LZ - CISS)
本文深入探讨了在小空间限制下实现Lempel-Ziv因式分解(LZ77与LZ78)的高效算法。基于后缀数组(SA)、逆后缀数组(ISA)、最长公共前缀(LCP)和简洁后缀树(SucST)等核心数据结构,文章详细阐述了如何在仅有(1+ε)n lg n位工作空间内完成因式分解,并支持常数时间因子访问。针对LZ77,提出了多轮从叶子到根遍历的策略以处理无额外输出空间的情形;对于LZ78,则引入‘见证节点’概念并通过level_anc查询消除对字母表大小σ的依赖。算法在时间效率与空间节省之间实现了良好平衡,适用于数原创 2025-09-23 15:31:59 · 17 阅读 · 0 评论 -
26、字母依赖的字符串搜索与相关算法优化
本文探讨了基于指数搜索树的字符串搜索方法及其算法优化,涵盖树的分裂与刷新、静态前驱结构重建等核心操作,并分析了定理2的摊还与最坏情况版本。同时,文章将理论应用于Lempel-Ziv压缩算法,在小空间环境下实现了高效的LZ77和LZ78分解,提出一种使用(1+ϵ)n lg n + O(n)位空间、运行时间为O(n/ϵ²)的新算法,显著提升了时间与空间效率。原创 2025-09-22 10:03:01 · 13 阅读 · 0 评论 -
25、基于加权指数搜索树的字母依赖字符串搜索
本文提出了一种基于加权指数搜索树的新型数据结构,用于提升字母表依赖场景下的字符串搜索效率。通过引入加权机制,改进了传统指数搜索树在静态与动态字典树操作中的时间复杂度,实现了确定性最坏情况下的高效前驱与前缀查询。该方法在压缩字典树、后缀树更新及数据库索引等场景中具有广泛应用,显著优于现有方案的搜索与更新性能。原创 2025-09-21 16:42:55 · 21 阅读 · 0 评论 -
24、高维范围最小查询与字母表相关字符串搜索技术解析
本文深入解析了高维范围最小查询(RMQ)与字母表相关的字符串搜索技术。针对高维数组,提出了空间高效的递归索引结构和简洁的RMQ索引方法,在查询时间与空间使用之间实现良好平衡;在字符串搜索方面,重点介绍了加权指数搜索树在静态/动态字典树及后缀树中的应用,显著提升了模式查找与更新操作的效率。文章结合理论分析与流程图示,为高维数据处理与大规模字符串检索提供了可行的技术路径与实践建议。原创 2025-09-20 09:51:33 · 24 阅读 · 0 评论 -
23、盒装网格排列与高维范围最小查询索引算法解析
本文深入分析了盒装网格排列算法的时间复杂度,提出BPPM问题可在O(n² log m)时间内解决。重点研究高维范围最小查询(d-RMQ)问题,基于递归分区与制表技术,设计了两种高效索引结构:其一实现O(N)位空间与O(1)查询时间,其二引入参数c实现亚线性空间下的时间-空间权衡。文章详细阐述还原技术、一维RMQ基础构建及多维扩展方法,并探讨其在数据库、信息检索与计算生物学中的应用,最后展望未来优化方向与动态场景拓展。原创 2025-09-19 16:10:38 · 25 阅读 · 0 评论 -
22、盒装网格排列的改进算法
本文研究盒装网格排列模式匹配(BPPM)问题,首先证明了模式在文本中特定区间内出现的唯一性,进而详细阐述了时间复杂度为$O(n^2m)$的算法框架,包括f-盒装子序列、下界与上界、集合$Z_j$等核心概念及关键引理。在此基础上,提出改进的$O(n^2 \log m)$时间复杂度算法:通过将中间子序列$z$存储于顺序统计树以优化基本操作至$O(\log m)$时间,并引入$\pi$函数跳过重复的顺序同构检查。同时给出了计算$\pi$函数的算法及其流程图。最终总结两种算法的时间复杂度与优化策略,展示了其在字符串原创 2025-09-18 12:56:43 · 25 阅读 · 0 评论 -
21、重叠有向图可读性与盒装网格排列模式匹配问题研究
本文研究了重叠有向图的可读性与盒装网格排列模式匹配(BPPM)问题。在图的可读性方面,重点分析了树结构的可读性,证明其上界等于图的半径,并通过归纳构造展示了该界是紧的;同时指出图的可读性无法由其独特性函数上界。在BPPM问题中,提出了两种改进算法:基于固定起始位置的O(n²m)算法和利用顺序统计树优化至O(n²log m)的高效算法,显著优于已有O(n³)方法。文章还探讨了字符串顺序同构判定、前缀表示μP计算等关键技术,并对未来研究方向如更优复杂度算法与实际性能验证进行了展望。原创 2025-09-17 15:27:15 · 22 阅读 · 0 评论 -
20、重叠有向图可读性研究
本文研究了重叠有向图的可读性问题,通过建立二分图与有向图之间的双射关系,证明了二者在渐近意义上的等价性。针对不同类型的图,提出了P4规则、严格P4规则和HUB规则,分别对树、无C4二分图和一般二分图的可读性进行了精确或近似刻画,并给出了可读性的上下界结果。研究还引入相异性参数和基于Hadamard码的图族H_k,证明了存在可读性为Ω(n)的图结构。最后总结了研究成果,回顾了研究方法,并展望了一般图的精确刻画、复杂图族分析及算法优化等未来方向。原创 2025-09-16 13:48:19 · 18 阅读 · 0 评论 -
19、快速字符串字典查找与重叠图可读性研究
本文探讨了快速字符串字典查找与重叠图可读性的理论研究。在字符串查找方面,分析了二进制字母表中一个不匹配及编辑距离为1(插入或删除)情况下的高效查询算法,结合字典树、反转字典树与正交范围搜索结构,优化空间与时间复杂度。在重叠图可读性方面,研究了有向图与二分图的可读性定义及其与图结构的关系,提出树和C4-自由图族的可读性界限,并通过计数论证和哈达玛码启发的构造给出下界。文章还展示了算法流程的mermaid图示,并展望了未来在算法优化与跨领域应用中的发展方向。原创 2025-09-15 11:29:55 · 25 阅读 · 0 评论 -
18、支持单错误的快速字符串字典查找
本文研究支持单错误的快速字符串字典查找问题,提出一种基于简洁双向索引和范围搜索的数据结构。通过将字符串划分为等长子串并利用按位异或编码,结合正交范围报告查询,实现了O(|p|/ω + occ)的最优查询时间,并在空间复杂度上取得良好平衡。算法适用于搜索引擎、生物信息学等存在拼写错误或测序误差的近似匹配场景,具备良好的扩展性与实际应用价值。原创 2025-09-14 11:39:22 · 29 阅读 · 0 评论 -
17、最小错误校正(MEC)的参数可处理性与近似性研究
本文研究了最小错误校正(MEC)问题在单倍型组装中的参数可处理性与近似性,重点介绍了无间隙MEC的固定参数可处理(FPT)算法和二进制MEC的2-近似算法。无间隙MEC算法基于动态规划,以片段最大长度ℓ为参数,时间复杂度为O(3^ℓ·ℓ·n);二进制MEC算法则提供了一种可在多项式时间内实现2倍近似的解决方案。文章总结了算法的关键步骤、复杂度及应用场景,并指出未来研究方向,包括无间隙MEC的近似复杂性、二进制MEC的计算复杂性以及面向新测序数据特征的FPT算法设计。原创 2025-09-13 13:37:36 · 39 阅读 · 0 评论
分享