linux6sysadmin
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
47、文本分类、逻辑推理与Web个性化的创新技术
本文介绍了三项创新技术:HIClass系统通过人机交互提升文本分类效率,BALIOS引擎为贝叶斯逻辑程序提供强大的概率推理能力,SEWeP系统则结合Web内容语义实现更精准的个性化推荐。这些系统在各自领域展现了独特优势,为相关技术发展提供了新思路。原创 2025-07-16 00:47:56 · 39 阅读 · 0 评论 -
46、数据挖掘工具与技术的前沿探索
本博客探讨了数据挖掘工具与技术的前沿进展,重点介绍了Orange框架在机器学习和交互式数据挖掘中的应用,展示了其Python脚本编写和可视化编程的强大功能。此外,博客还介绍了恐怖分子检测系统(TDS)在反恐领域的实时监控与分析能力,以及SnakeT聚类引擎在搜索引擎结果优化中的创新性贡献。通过这些案例,展示了数据挖掘与机器学习技术在实际应用中的价值和潜力。原创 2025-07-15 11:07:29 · 34 阅读 · 0 评论 -
45、前沿科技:驾驶意识检测、网页推荐与语义可视化的创新融合
本文介绍了三项前沿技术:驾驶意识检测系统、SUGGEST 网页推荐系统和 SemanticTalk 语义可视化工具。驾驶意识检测系统通过模拟实验与生理信号处理,实现对驾驶员注意力状态的判断;SUGGEST 推荐系统整合在线与离线分析,基于图模型和 LRU 算法为动态网站提供高效个性化推荐;SemanticTalk 则通过实时构建概念结构,支持头脑风暴和文档可视化,促进知识发现与信息检索。这些技术在各自领域展现了创新性和应用价值,未来有望进一步拓展和融合。原创 2025-07-14 16:20:59 · 31 阅读 · 0 评论 -
44、数据处理与分析的前沿技术探索
本文探讨了数据处理与分析领域的前沿技术,包括基于容差粗糙集模型(TRSM)的网页搜索结果聚类方法、提升RISE算法性能的SUNRISE算法、挖掘网页访问模式历史变化的FM-WAP方法以及空间时间序列数据的可视化挖掘系统CommonGIS。这些技术在信息检索、机器学习、网站运营和环境监测等多个领域展现了广泛的应用价值,并展望了未来在算法优化、多技术融合及实时处理等方面的发展趋势。原创 2025-07-13 12:05:28 · 50 阅读 · 0 评论 -
43、数据挖掘与模式发现的前沿技术探索
本文探讨了数据挖掘与模式发现领域的前沿技术,重点介绍了SnakeT、COCOA和TDM方法。SnakeT通过多源数据收集和层次化文件夹组织提升网页检索效率;COCOA通过压缩连续性分析高效挖掘时态数据库中的关联模式;TDM方法则从多变量时间序列中提取可解释的肌肉激活模式,在运动科学领域具有广泛应用。文章还总结了各技术的优势与应用场景,并展望了未来融合、智能化和跨领域发展的趋势。原创 2025-07-12 10:32:07 · 34 阅读 · 0 评论 -
42、数据挖掘中的模式比较、树构建与多源数据学习
本博客探讨了数据挖掘领域的三个重要主题:简单与复杂模式的比较框架、基于发育序列数据构建近似系统发育树的方法,以及多源数据下的高效学习策略。首先,提出了一种通用的模式相似性评估框架,支持简单模式和复杂模式的比较,并通过递归定义和聚合逻辑实现相似性计算。其次,介绍了利用动物发育事件序列数据构建系统发育树的方法,并通过实验验证了其有效性。最后,针对多源数据学习中的计算复杂性问题,提出了一种两阶段学习方法,通过独立学习和有偏学习相结合,显著降低了搜索空间和计算时间。这些方法在各自的研究和应用领域中具有重要意义。原创 2025-07-11 12:03:57 · 35 阅读 · 0 评论 -
41、隐私保护关联规则挖掘的新方案
本文提出了一种新的隐私保护关联规则挖掘方案,结合代数技术和随机噪声扰动,在保证数据挖掘准确性的同时显著提升了隐私保护水平。系统引入了双向通信机制,数据挖掘者向数据提供者发送扰动指导Δ,数据提供者据此对交易数据进行有针对性的扰动。通过奇异值分解(SVD)计算Δ,提取数据主要特征,减少不必要信息的披露。与传统随机化方法相比,该方案在准确性和隐私保护方面具有明显优势,并可灵活应用于在线调查、电子商务推荐系统和医疗数据挖掘等多个领域。实验结果表明,在真实数据集上该方法在相同准确性水平下披露的私人信息比以往方法少约五原创 2025-07-10 13:54:25 · 85 阅读 · 0 评论 -
40、处理噪声数据源中具有预测性但不可预测的属性
本文探讨了在现实世界数据中如何处理具有预测性但不可预测的属性中的噪声问题。文章介绍了传统方法如Polishing在处理属性噪声上的局限性,并提出了一种基于规则模式的筛选方法用于识别噪声实例。同时,研究了三种清理策略(删除、单替换和多替换)以提高数据质量,并引入概念等价性作为更合理的噪声测量标准。通过实验验证,新方法在识别和清理噪声方面的有效性及高效性得到了证实。此外,文章还展望了未来的研究方向,包括细化属性可预测性的判断标准、结合筛选方法与Polishing以及拓展研究领域至关联学习。原创 2025-07-09 12:48:50 · 49 阅读 · 0 评论 -
39、利用中医知识进行文本挖掘以发现相关基因的功能群落
本文探讨了如何利用中医知识结合现代生物医学文献进行文本挖掘,以发现相关基因的功能群落。通过自举技术和术语共现方法,从中医文献中提取疾病名称并构建疾病-基因关系网络,重点分析了肾阳虚症状复合体的相关基因及其潜在的功能联系。研究为整合中医整体观念与现代生命科学提供了新的视角,并展望了未来在蛋白质相互作用、多策略学习和术语提取技术方面的深入探索方向。原创 2025-07-08 09:45:11 · 53 阅读 · 0 评论 -
38、基于障碍物和促进因素的密度空间聚类方法
本文介绍了一种新的空间聚类方法——DBRS+,该方法能够同时处理障碍物和促进因素对数据对象可达性的影响。通过详细分析背景、相关工作以及算法的核心机制,展示了DBRS+在合成和真实数据集上的高效性和准确性。实验结果表明,DBRS+不仅运行速度快,而且能够灵活适应复杂的空间约束条件,为资源规划、市场营销和疾病扩散分析等实际应用提供有力支持。原创 2025-07-07 13:53:00 · 49 阅读 · 0 评论 -
37、火星地形聚类新颖性量化研究
本文提出了一种评估聚类新颖性的方法,通过量化聚类与已知分类之间的重叠程度,识别潜在的新颖聚类。研究将该方法应用于火星地形数据,利用排水网络特征对火星景观进行聚类,并与基于地质单元的传统分类进行比较。通过量化重叠程度及其分解,分析聚类与分类之间的相似性或不相似性,从而判断聚类是否指向火星地形的新颖分类。研究还提出了未来工作的方向,包括更多数据集的验证、结合其他地形特征、改进聚类算法以及深入结合领域知识。原创 2025-07-06 15:08:51 · 57 阅读 · 0 评论 -
36、基于异步和预过滤流的频繁项集挖掘并行算法
本文介绍了一种基于异步和预过滤流的并行频繁项集挖掘算法,旨在解决现有方法中存在的同步通信密集、工作负载不平衡以及资源利用率低的问题。该算法利用过滤流编程模型实现了候选生成的异步性和高效的资源利用,并通过预过滤机制加速了频繁项集的确定过程。实验表明,该算法在处理大规模数据集时具有良好的并行效率和可扩展性,尤其在数据分布存在偏斜的情况下表现出色。原创 2025-07-05 16:38:51 · 87 阅读 · 0 评论 -
35、结合Winnow和正交稀疏二元组进行增量垃圾邮件过滤
本文提出了一种结合Winnow算法和正交稀疏二元组(OSB)的增量垃圾邮件过滤方法。Winnow作为一种统计但非概率的分类算法,具有良好的错误率表现,并支持快速增量学习。正交稀疏二元组作为特征组合技术,在保持高表达能力的同时显著降低了计算成本。实验结果表明,该方法在Spam Assassin测试语料库上表现出色,错误率低于现有主流方法如CRM114和朴素贝叶斯。此外,文章还探讨了预处理、分词模式、窗口大小等因素对分类准确性的影响,并提出了未来改进方向,如引入误分类成本度量、特征强度以及优化修剪算法等,为提升原创 2025-07-04 16:25:04 · 58 阅读 · 0 评论 -
34、项集分类聚类:数据挖掘新方法
本文介绍了一种新的数据挖掘方法——项集分类聚类,旨在解决由特征项集和目标向量表示的新型数据集的聚类与分类问题。传统方法如聚类-分类或双聚类可能无法生成与特殊特征相关联的簇,而项集分类聚类通过由公共项集表示的划分来最大化类间方差,从而找到最优的分类簇。文章形式化了该问题,提出了基于类间方差的评估指标,并设计了高效的剪枝算法来处理大规模数据。实验结果表明,该方法在酵母基因表达数据集上具有良好的可扩展性和实用性,为生物学、医学和电子商务等领域的数据分析提供了新的视角。原创 2025-07-03 14:31:17 · 67 阅读 · 0 评论 -
33、深入探究受体剪接位点预测:迭代特征选择方法
本文提出了一种用于拟南芥中受体剪接位点预测的迭代特征选择方法。通过比较多种分类器和特征选择技术,研究发现特征选择能显著提升分类性能,尤其是在基于朴素贝叶斯的模型上。文章还介绍了一种基于估计分布算法(EDA-R)的特征加权方案,并成功识别了具有生物学意义的新特征——AG扫描特征。这些结果不仅有助于理解剪接位点附近的核苷酸依赖关系,也为未来的基因预测系统优化提供了方向。原创 2025-07-02 16:42:00 · 46 阅读 · 0 评论 -
32、地理信息系统中的分类方法探索
本文探讨了地理信息系统(GIS)中基于改进ID3算法的分类方法,重点研究如何利用多边形区域面积计算空间信息增益,并通过实际数字地图实验验证了该方法的有效性。文章详细介绍了空间数据模型、空间决策树(SDT)的构建过程以及如何选择最佳分割图层,同时提出了未来研究方向,如扩展几何类型支持、优化数据预处理和考虑层内关系等,旨在提升GIS在农业及其他领域的分类性能和应用价值。原创 2025-07-01 13:27:44 · 46 阅读 · 0 评论 -
31、肝炎临床数据集规则有趣性度量评估
本研究聚焦于医学数据挖掘领域,以肝炎临床数据集为基础,评估规则有趣性的客观度量方法。通过对比传统客观度量与医学专家的真实兴趣,探讨这些度量在发现真正有趣规则方面的性能和潜力。实验结果显示,部分客观度量如Recall、Jaccard、Kappa、CST和Peculiarity表现优异,并且组合使用这些度量有助于提升基于人机交互的知识发现过程。未来的研究方向包括进一步验证实验结果、探索新度量、优化组合方法以及加强人机交互应用。原创 2025-06-30 14:31:25 · 42 阅读 · 0 评论 -
30、基于哈希方法的Apriori图挖掘算法解析
本文介绍了一种基于哈希方法改进的Apriori图挖掘算法AGM-Hash,旨在从图数据中高效挖掘频繁出现的诱导子图模式。文章详细解析了图和问题的基本定义、AGM-Hash算法的关键步骤以及实验性能评估结果,并通过对比分析展示了AGM-Hash相较于原始AGM算法在计算时间和候选矩阵数量上的优化效果。未来的工作方向包括进一步研究图不变量、设计更高效的哈希表以及将该方法扩展到其他图挖掘算法中。原创 2025-06-29 14:18:19 · 55 阅读 · 0 评论 -
29、朴素贝叶斯分类器可视化的列线图方法
本文介绍了使用列线图可视化朴素贝叶斯分类器的方法。通过图形化展示属性值对类别概率的定量影响,列线图不仅提供了直观的预测结果,还揭示了模型结构和属性的重要性。文章以泰坦尼克号乘客生存概率为例,详细推导了列线图的构建过程,并讨论了置信区间的引入和实现方法。此外,还分析了其在医疗诊断和金融信贷等领域的实际应用,并展望了未来的发展方向,如多类别可视化改进和实时数据更新。原创 2025-06-28 15:37:12 · 74 阅读 · 0 评论 -
28、保险数据中的客户流失分析:案例研究
本文探讨了瑞士人寿保险公司的客户流失预测问题,重点分析如何处理时间戳数据以提高预测准确性。文章通过对比多种数据处理方法,验证了TF/IDF特征在客户流失预测中的有效性,并提出了一种启发式方法用于评估转换为TF/IDF特征的可行性。研究为类似保险数据分析案例提供了可借鉴的方法和实践经验。原创 2025-06-27 12:33:07 · 134 阅读 · 0 评论 -
27、基于约束的情节规则挖掘与最优窗口大小
本文研究了基于约束的情节规则挖掘与最优窗口大小的确定问题,提出了一种健全且完整的算法WinMiner,用于在最大间隙约束下挖掘频繁且置信的情节规则,并为每个规则找到对应局部最大置信度的最小窗口大小。传统方法如Winepi和Minepi依赖固定的窗口大小或最大间隙阈值,但无法有效处理不同规则可能需要不同窗口大小的实际场景。WinMiner通过引入最小前缀出现(mpo)概念和E/O-对机制,克服了现有算法的不完整性问题,能够更准确地挖掘事件序列中具有潜在关联的情节规则。实验表明,在实际地震数据集中,该算法能够高原创 2025-06-26 09:39:17 · 32 阅读 · 0 评论 -
26、用于有效聚类的文本光谱分析
本文提出了一种基于光谱分析的文本聚类方法,旨在解决用户在聚类过程中难以确定自然聚类数量的问题。通过分析文本集合相似性空间的特征值分布,该方法能够快速准确地估计聚类数量,并提供聚类质量的反馈,从而增强用户与聚类算法之间的交互效率。文章从理论和实证两个方面验证了方法的有效性,并展示了其在不同数据集上的广泛适应性和应用潜力。原创 2025-06-25 15:09:36 · 69 阅读 · 0 评论 -
25、用于分类的增量非线性主成分分析
本文提出了一种用于分类的增量非线性主成分分析方法(OL-NPCA),旨在解决传统主成分分析(PCA)和核主成分分析(KPCA)在处理高维、非线性数据时存在的计算复杂性和内存需求问题。该方法通过增量特征空间更新技术结合多项式特征映射函数,实现了高效的数据特征提取,并将提取的特征输入最小二乘支持向量机(LS-SVM)进行分类。实验结果表明,OL-NPCA不仅具有与批量KPCA相当的特征提取能力,而且显著降低了内存需求,在多个数据集上表现出良好的分类性能。原创 2025-06-24 10:22:43 · 38 阅读 · 0 评论 -
24、分布式分类器的隐私计算
本文提出了一种基于安全多方计算的分布式分类器隐私计算方法,旨在解决在多个数据源之间进行数据挖掘时的隐私保护问题。通过引入不可信但不勾结的第三方,并结合加密技术和随机份额分割思想,确保在不泄露各站点数据细节的前提下,实现高效的全局k最近邻分类。文章还分析了算法的安全性、通信与计算成本,并探讨了其在实际应用中的潜力和未来优化方向。原创 2025-06-23 16:31:11 · 36 阅读 · 0 评论 -
23、集成特征排序:原理、方法与实验验证
本文提出了一种基于集成学习的特征排序方法(EFR),结合遗传算法(ROGER)优化接收者操作特征(ROC)曲线下面积(AUC)准则,用于解决监督机器学习中的特征选择问题。通过统计验证模型和大量实验,分析了EFR在线性和非线性目标概念下的性能表现,并与其他特征排序方法进行了对比。结果表明,EFR在处理非线性、高维特征空间问题时具有明显优势,特别是在示例数量有限的情况下。原创 2025-06-22 15:43:23 · 73 阅读 · 0 评论 -
22、大型数据库中的厚天际线挖掘
本文介绍了在大型数据库中进行厚天际线(Thick Skyline)挖掘的新概念及相关算法。传统的天际线操作符只能返回单一的最优对象,无法满足实际应用中对邻域候选对象的需求。为此,文章提出了厚天际线的概念,将天际线对象及其邻域内的相关对象一并纳入查询结果,从而提供更全面的信息。文中详细描述了三种适用于不同场景的厚天际线挖掘算法:采样与剪枝方法、索引与估计方法以及微簇方法,并通过实验评估和实际案例展示了它们的性能与应用价值。原创 2025-06-21 09:05:38 · 54 阅读 · 0 评论 -
21、网页集合中动态内容的摘要提取
本文探讨了在动态且异构的网络环境中,如何从网页集合中提取动态内容的摘要。不同于传统基于静态文档或新闻事件的摘要方法,该研究专注于单个网页随时间变化的内容演变,并通过插入和删除句子的变化类型进行分析。提出的方法利用滑动窗口计算术语得分,结合删除与插入内容中的词频与文档频率,生成包含热门概念的时间性摘要。实验表明,构建紧密相关的网页集合以及选择合适的窗口长度对摘要效果至关重要。文章还讨论了方法的优势、挑战及未来改进方向,如优化算法效率并拓展至多属性融合。原创 2025-06-20 13:34:18 · 135 阅读 · 0 评论 -
20、可扩展的基于密度的分布式聚类算法解析
本文提出了一种可扩展的基于密度的分布式聚类算法(SDBDC),用于解决传统集中式聚类方法在海量异构数据场景下的不足。该算法通过在本地站点计算对象的静态和动态表示质量,筛选出合适的本地代表,并将这些代表传输到全局站点进行增强的DBSCAN聚类分析。这种方法不仅有效处理了局部噪声,还允许用户根据需求在聚类质量和运行时间之间进行权衡。实验结果表明,SDBDC在较少的数据传输量下能够保持较高的聚类质量,并且在超市连锁、天文学和移动网络等实际应用场景中具有广泛的应用潜力。原创 2025-06-19 16:47:32 · 36 阅读 · 0 评论 -
19、足球比赛记录与科技监测中的数据挖掘新方法
本文探讨了数据挖掘技术在足球比赛记录分析和科技监测中的创新应用。针对足球比赛记录,提出了基于多尺度匹配和聚类方法的传球模式分析方法,以揭示球队的策略特征。对于科技监测领域,开发了UnexpectedMiner系统,并引入新的度量方法用于发现意外信息。同时,对两种方法的不足进行了分析,并提出了优化建议,如引入球员运动传感器数据、改进文档相似性度量以及使用分布式计算提升效率。研究表明,这些方法在体育和科技领域具有重要的应用前景。原创 2025-06-18 13:46:18 · 37 阅读 · 0 评论 -
18、蛋白质指纹分类:提升准确性的探索
本文探讨了利用数据驱动的分类模型改进蛋白质指纹标注的方法,旨在克服传统工具PRECIS依赖SWISS-PROT信息滞后及启发式方法导致的分类错误问题。通过提取指纹、基序和蛋白质三个层面的特征,并采用多种机器学习算法进行实验,最终发现SVM-RBF模型在交叉验证和盲测中均表现出色,错误率分别约为14.06%和14.65%。研究还分析了SVM-RBF泛化能力的来源以及不同特征类型的贡献,结果表明非知识型特征对分类性能影响更大。未来工作将聚焦于纠正数据不平衡和引入更多判别信息以进一步降低错误率。原创 2025-06-17 16:20:55 · 40 阅读 · 0 评论 -
17、基于文档和术语标签交互式监督的文本分类
本文介绍了一种基于文档和术语标签交互式监督的文本分类系统HIClass。该系统结合了人类的认知能力与自动化学习器的能力,通过主动学习机制,从少量标注文档和大量未标注文档中高效学习。HIClass支持特征工程、文档和术语级主动学习,并通过类似OLAP的界面让用户动态调整分类模型中的术语-类别权重,从而构建更准确且可解释的分类器。实验表明,HIClass在多个文本分类任务中表现优异,显著减少了用户的标注负担并提升了分类性能。原创 2025-06-16 10:11:50 · 82 阅读 · 0 评论 -
16、0 - 1 数据中的几何和组合瓷砖模型
本文探讨了在大型0-1数据集中使用几何和组合瓷砖模型进行数据分析的方法。针对传统关联规则和聚类方法存在的不足,引入了一种新的概率模型——分层瓷砖模型,用于描述数据中1的出现位置。提出了寻找几何瓷砖的局部搜索算法,并结合谱排序方法将组合瓷砖转化为几何瓷砖。通过实验验证了算法的有效性,并比较了不同搜索策略的性能。研究表明,该模型能够为0-1数据提供自然且可解释的概率结构,具有广泛的应用潜力。原创 2025-06-15 11:38:20 · 31 阅读 · 0 评论 -
15、小样本学习:小训练集下分类器的比较
本文探讨了在小训练集和类别分布不匹配的条件下,多种机器学习模型在二元文本分类任务中的表现。通过实验分析支持向量机、逻辑回归、朴素贝叶斯等算法与特征选择方法结合的效果,揭示了不同性能指标(如TP10、TN100和F值)下最优模型的适用场景,并提出了基于学习表面的元知识指导分类器选择的方法。原创 2025-06-14 14:35:31 · 37 阅读 · 0 评论 -
14、微阵列数据中调控关系的发现
本文介绍了一种基于时间序列微阵列数据发现基因间潜在调控关系的新方法。通过预处理步骤捕捉基因表达的动态特征,并结合动态贝叶斯网络分类器和马尔可夫链蒙特卡罗采样技术,有效识别共调控和受控调控关系。实验结果表明该方法在酵母细胞周期数据集中具有较高的准确率,能够为基因调控网络的研究提供重要参考。原创 2025-06-13 11:50:21 · 27 阅读 · 0 评论 -
13、基于树的 XML 文档结构聚类方法
随着XML数据源的异质性增加,基于结构特征对XML文档进行组织变得愈发重要。本文提出了一种基于树的XML文档结构聚类方法,通过构建最优匹配树、合并树以及修剪合并树,得到能够反映聚类中显著结构特征的聚类代表。该方法在合成数据和真实数据上均验证了其有效性,并为未来的研究提供了多个扩展方向。原创 2025-06-12 16:43:03 · 42 阅读 · 0 评论 -
12、校准分类器的特性与优势
本博客探讨了校准分类器在决策和分类任务中的重要特性与优势。通过分析校准与贝叶斯误差之间的关系,以及如何利用校准过程优化分类器的后验概率估计,研究表明校准不仅能提高预测可靠性,还能改善分类准确率并帮助确定最优决策阈值。实验结果显示,在有限数据条件下,远离校准的模型(如朴素贝叶斯)在校准后表现出显著性能提升,而接近校准的模型则对噪声更敏感,容易因过拟合导致性能波动。此外,校准方法在处理多次穿过 0.5 的映射时比传统 ROC 方法更具优势,并为未来研究方向提供了理论支持,包括多分类问题扩展、半监督学习应用及小样原创 2025-06-11 16:51:01 · 32 阅读 · 0 评论 -
11、AutoPart:无参数图划分与离群点检测
本文介绍了一种基于信息论和无损压缩原理的新型无参数图划分与离群点检测方法AutoPart。该方法通过MDL(最小描述长度)原则,将图结构中的邻接矩阵重新排列并划分为同质块,从而实现节点聚类、离群边识别以及簇间距离计算的目标。AutoPart具有自动化、可扩展性强、支持在线计算等特性,并在合成数据集和真实数据集上均表现出色,适用于社交网络分析、Web图分析及生物网络分析等多种实际场景。原创 2025-06-10 16:46:47 · 32 阅读 · 0 评论 -
10、不同粒度级别的空间关联分类:概率方法
本文提出了一种基于概率方法的多粒度空间关联分类模型,结合空间关联规则发现与朴素贝叶斯分类器,以处理空间数据挖掘中的复杂问题。通过SPADA算法在不同粒度级别上生成关联规则,并利用领域知识和空间层次结构支持定性推理,从而提升分类准确性。文章详细介绍了方法框架、理论基础以及在英格兰西北部人口普查数据中的实际应用,展示了该方法在发现潜在空间关联和构建有效分类模型方面的优势。同时,也探讨了其局限性和未来发展方向。原创 2025-06-09 16:21:36 · 27 阅读 · 0 评论 -
9、数据挖掘模式管理框架
本文提出了一种综合性的数据挖掘模式管理框架,用于处理模式的异构性、时间信息及操作查询需求。通过引入基于模式的管理系统(PBMS)以及时间模式操作语言(TPML)和时间模式查询语言(TPQL),该框架支持先验模式与后验模式的统一管理与查询。文章还讨论了模式的有效性问题,并对现有相关方法进行了对比分析,展示了所提框架的优势与创新之处。原创 2025-06-08 13:45:26 · 40 阅读 · 0 评论 -
8、基于循环树状直方图的数据流滑动窗口缩减技术
本文提出了一种基于循环树状直方图(c-树直方图)的数据流滑动窗口缩减技术。该方法通过构建层次结构的树形直方图,支持对滑动窗口内的数据进行高效压缩和近似任意范围求和查询。c-树直方图利用位节省编码减少存储开销,同时保持对任意位置范围查询的一致准确性。实验表明,与V-最优直方图和小波直方图相比,c-树在查询准确性和时间效率上具有优势,尤其适用于内存受限的数据流环境。原创 2025-06-07 15:01:51 · 43 阅读 · 0 评论
分享