a1b2c
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
30、电子鼻噪声与漂移处理及归纳数据库查询逻辑框架
本博文围绕电子鼻噪声与漂移处理以及归纳数据库查询逻辑框架展开深入研究。针对电子鼻在实际应用中受到的噪声和漂移干扰,提出基于核模糊C均值聚类和模糊SVM的K-FSVM方法,有效提升了数据处理的准确性和稳定性。同时,归纳数据库部分探讨了默认理论语义、异常值定义及表达能力,构建了查询逻辑框架,为数据挖掘和数据库系统设计提供了理论支持。研究兼具理论深度与实际应用价值,为相关领域的发展提供了新思路。原创 2025-08-23 00:53:14 · 48 阅读 · 0 评论 -
29、数据挖掘任务逻辑与XEdge高效方法
本文探讨了数据挖掘与数据库技术融合的重要性,并介绍了XEdge方法和基于复杂值数据模型的归纳数据库逻辑框架。XEdge方法利用XML文档的多粒度结构信息,提高了关键词查询的精度和效率;而归纳数据库逻辑框架则提供了一种高效、可扩展的方式,用于处理频繁模式挖掘、聚类分析、决策树归纳和异常值检测等任务。文章还通过详细的操作步骤和实际应用案例,展示了两种技术的优势及未来发展前景。原创 2025-08-22 13:29:59 · 53 阅读 · 0 评论 -
28、XEdge:用于 XML 关键字搜索的有效聚类结果返回方法
本文介绍了一种高效的XML关键字搜索结果聚类方法——XEdge算法。该方法通过引入聚类紧凑粒度(CCG)和子树紧凑粒度(SCG)来实现对搜索结果的聚类与排序,同时定义了紧凑LCA(CLCA)语义以提升结果的准确性。实验表明,XEdge在聚类数量、精度和召回率方面均优于现有方法如XSeek和XKLUSTER,有效解决了无意义结果、屏蔽效应和结果无聚类等问题,为XML关键字搜索提供了一个更实用的解决方案。原创 2025-08-21 12:29:45 · 97 阅读 · 0 评论 -
27、实时多媒体集合探索系统RTExp:技术解析与应用实践
本文介绍了实时多媒体集合探索系统RTExp,其采用分层架构设计,结合实时相似性搜索和直观的用户界面,为用户提供流畅的大规模多媒体数据探索体验。系统在移动设备上的应用和性能优化是其核心亮点,同时通过实验评估验证了其在不同数据集上的有效性。未来的工作将聚焦于进一步提升系统精度和可视化能力。原创 2025-08-20 09:45:29 · 33 阅读 · 0 评论 -
26、大型对象集合的功能数据库表示
本文讨论了如何在功能数据库中高效表示和操作大型对象集合,重点介绍了O-树索引结构及其在处理复杂网络分析任务中的应用。通过基于闭包算子的数学方法,能够有效分析网络的全局结构和动态变化,展示了在社交网络等具有复杂结构的数据集上的实际价值。文章还比较了O-树与传统B+-树的性能优势,并通过具体示例和实验验证了其高效性。原创 2025-08-19 15:08:24 · 42 阅读 · 0 评论 -
25、混合工作负载环境下内存列式存储的拆分字典
本文提出了一种名为拆分字典(Split Dictionaries)的内存列式存储优化方案,旨在解决混合工作负载环境中传统排序字典和未排序字典在性能与资源消耗上的权衡问题。拆分字典结合了排序和未排序字典的优点,通过将字典拆分为多个固定大小的部分,并在字典满时进行异步排序和合并,从而降低合并成本,同时保持高效的范围查询性能。文章还分析了拆分字典的内存使用模型,并通过实验评估其在插入、解压缩、合并和范围查询等操作中的表现,结果显示其在多数场景下优于传统方法。未来的工作包括自动调整字典大小和原地合并算法的优化。原创 2025-08-18 13:34:50 · 36 阅读 · 0 评论 -
24、基于多智能体交互的多虚拟身份关联挖掘
本文提出了一种基于多智能体交互和知识管理的多虚拟身份关联识别模型MVIA-K。通过引入时间切片分析用户行为特征,结合分布式挖掘和知识流动机制,该模型能够有效过滤噪声数据,识别多个虚拟身份之间的潜在关联。实验结果表明,MVIA-K在实际数据集上优于传统的Author Topic模型,为网络空间中虚拟身份识别问题提供了一种高效解决方案。原创 2025-08-17 12:11:53 · 52 阅读 · 0 评论 -
23、社交网络中网络欺凌检测的半监督学习方法
本文提出了一种用于社交网络中网络欺凌检测的半监督学习方法,通过特征空间建模生成丰富的语言特征,并结合基分类器与置信函数提取可靠的正例和负例,从而增强训练集。此外,引入模糊SVM算法和K-FCM聚类方法处理社交网络数据的复杂性与不平衡性,提高了模型的泛化能力和准确性。实验结果表明,该方法在不同场景下均表现优异,尤其在召回率方面具有显著优势,为网络欺凌检测提供了有效的解决方案。原创 2025-08-16 10:58:50 · 89 阅读 · 0 评论 -
22、信息论聚合协同聚类与网络欺凌半监督检测
这篇博文主要探讨了两个研究主题:信息论聚合协同聚类和社交网络中的网络欺凌半监督检测。第一部分介绍了基于信息论目标的协同聚类方法 CoClusLSH,通过合成数据集和真实数据集验证了其聚类性能和可扩展性。第二部分则提出了一种半监督学习方法,用于解决社交网络中网络欺凌检测的挑战,包括增强训练和模糊支持向量机(FSVM),实验结果表明该方法在标注数据有限的情况下具有良好的性能。原创 2025-08-15 11:46:25 · 96 阅读 · 0 评论 -
21、快速信息论聚合协同聚类算法解析
本文介绍了一种快速的聚合层次协同聚类算法 CoClusLSH,该算法基于信息论目标函数,能够自动确定行和列的聚类数量。通过局部敏感哈希(LSH)技术快速找到相似聚类进行合并,并以线性复杂度处理大规模二进制矩阵数据。实验表明,该算法在聚类质量和可扩展性方面均表现优异,适用于多种应用场景。原创 2025-08-14 12:03:39 · 65 阅读 · 0 评论 -
20、基于SSD的数据库综合分析
本文对基于SSD和HDD的数据库系统进行了全面的实验分析,重点比较了两者在顺序与随机访问吞吐量、混合工作负载以及哈希连接操作中的性能差异。实验结果表明,SSD在I/O吞吐量和并行处理能力方面显著优于HDD,尤其在随机读取和混合工作负载场景中表现突出。此外,文章探讨了如何通过合理设置哈希表大小以及利用剩余资源来优化数据库性能,特别是在多哈希连接查询和并行查询执行中提升整体性能。原创 2025-08-13 10:49:12 · 31 阅读 · 0 评论 -
19、高效数据处理:轨迹检索与SSD数据库分析
本文探讨了大数据时代下的高效数据处理与分析技术,重点包括轨迹检索和固态硬盘(SSD)在数据库查询处理中的应用。在轨迹检索方面,提出了一种新的查询方法k-TLT,结合位置和旅行时间信息高效检索前k条轨迹,并通过候选集生成与细化验证的两步法提高效率。同时,分析了SSD数据库在哈希连接操作中的性能优势,提出了优化策略,如哈希表大小调整、数据访问局部性优化等。通过这些方法,可以显著提升轨迹检索和数据库查询的性能,为交通规划、物流管理、决策支持系统等领域提供强有力的技术支持。原创 2025-08-12 16:10:20 · 31 阅读 · 0 评论 -
18、高效检索按位置和旅行时间排序的前 k 条轨迹
本文介绍了一种高效检索按位置和旅行时间排序的前k条轨迹的方法。重点讨论了轨迹查询中的核心概念,包括轨迹与点集的到达时间计算,并详细对比了朴素方法和增量方法两种查询处理策略。通过实验评估,增量方法尤其是基于位集的实现,在执行时间和计算效率上表现突出,适用于大规模轨迹数据的高效检索场景。原创 2025-08-11 11:50:34 · 41 阅读 · 0 评论 -
17、集体组关系发现与轨迹检索研究
本博客主要探讨了集体组关系发现与高效轨迹检索的相关研究。在集体组关系发现方面,通过提出GRAPE方法,在生物领域的NCI-60数据集和书目领域的DBLP数据集上进行了实验,验证了其在识别基因与miRNA、作者与术语之间的集体组关系(CGRs)方面的有效性,并揭示了其在生物学意义和研究趋势挖掘方面的潜力。在轨迹检索方面,提出了k-TLT查询方法,通过整合轨迹点的速度信息到R-树结构中,实现了按位置和旅行时间高效检索前k条轨迹,为旅行路线规划和移动对象研究提供了有效支持。整体研究展示了在不同应用场景下的方法优势原创 2025-08-10 16:25:54 · 47 阅读 · 0 评论 -
16、集体组关系发现:GRAPE方法解析
本文介绍了一种名为GRAPE的方法,用于从异构数据集中发现集体组关系(Collective Group Relationships, CGRs)。该方法结合了典范相关分析(CCA)和准团挖掘技术,既能够提供集体关系的定量度量,又能够揭示其定性结构信息。通过在合成数据集和真实世界数据集(如基因表达数据、社交网络数据和生态系统数据)上的实验验证,GRAPE在识别CGRs方面表现出较高的精确率、召回率和归一化互信息(NMI)值,优于现有方法。文章还讨论了GRAPE的优势与局限性,并提出了未来的研究方向,如优化算法原创 2025-08-09 12:44:16 · 77 阅读 · 0 评论 -
15、基于主题词库扩展的Twitter情感分析
本文提出了一种基于主题词库扩展的Twitter情感分析方法。该方法利用表情符号作为参考标记,结合点互信息(PMI)计算,对通用情感词库进行扩展,以适应不同主题下的情感分类需求。实验表明,基于主题的词库扩展显著提高了基于词库的分类器(如SentiStrength)的性能,并有效处理了Twitter中的非正式表达和缩写词。此外,该方法在市场调研、舆情监测和品牌管理等实际场景中具有广泛的应用价值。原创 2025-08-08 09:03:58 · 55 阅读 · 0 评论 -
14、个性化推荐与Twitter情感分析技术解析
本博客详细解析了个性化推荐算法和Twitter情感分析技术。个性化推荐算法基于二分网络投影,通过评分感知和资源分配优化推荐效果,与传统算法相比性能显著提升。Twitter情感分析技术通过基于主题的词典扩展方法,有效提高了情感分类的准确性。博客还探讨了两种技术在电子商务推荐、媒体娱乐、品牌监测、市场调研等领域的应用及优化方向,为相关领域的发展提供了有力支持。原创 2025-08-07 15:35:28 · 44 阅读 · 0 评论 -
13、基于负反馈感知与评分整合的个性化推荐算法解析
本文提出了一种基于负反馈感知与评分整合的个性化推荐算法,通过引入自适应用户偏好模型、根据用户评分加权分配初始资源以及在资源分配过程中考虑评分比例,有效提高了推荐的准确性。实验结果表明,该算法在命中率和平均排名得分等指标上均优于基线算法。原创 2025-08-06 10:38:40 · 50 阅读 · 0 评论 -
12、利用GPU实现高效子图匹配及相关推荐算法解析
本文详细解析了利用GPU实现高效子图匹配的方法,包括连接树的选择、叶子节点顺序优化、GPU上的哈希表实现、连接STwig结果的算法以及存储策略。同时,还介绍了一种基于二分网络投影的负感知和评分集成推荐算法,该算法通过丰富用户偏好模型和考虑链接传输速率,提高了推荐的准确性和有效性。实验验证了GPU算法在不同数据图和查询图属性下的性能优势,加速比可达26倍。通过不断优化算法和结合新技术,子图匹配和推荐算法在大规模数据处理中具有重要的应用价值。原创 2025-08-05 15:04:23 · 36 阅读 · 0 评论 -
11、新兴序列模式与高效子图匹配的研究
本文围绕新兴序列模式(ESPs)和高效子图匹配展开研究。针对ESPs在预测模式持续出现时表现不佳的问题,分析了其可能由噪声或数据波动引起的原因,并提出了结合统计方法和扩展定义的改进建议。在高效子图匹配方面,回顾了传统算法的局限性,并介绍了基于GPU的优化算法,通过合理选择连接树和使用哈希表显著提升了性能。实验结果表明,该GPU算法在时间效率和内存使用方面均优于现有方法。最后,文章展望了未来的研究方向,包括进一步优化ESPs定义和拓展GPU算法的应用领域。原创 2025-08-04 10:03:51 · 41 阅读 · 0 评论 -
10、新兴序列模式应用研究
本文研究了新兴序列模式(ESPs)在带时间戳数据集中的预测效果,并与频繁模式的预测效果进行了比较。通过实证评估,发现ESPs在某些情况下能够提供高精度的预测,但与频繁模式相比,其预测优势并不显著。研究还指出,ESPs在预测模式持续出现和季节循环出现方面存在局限性,提出了未来改进的方向,如优化ESPs定义、探索新的挖掘算法以及结合其他数据挖掘技术,以提升其预测精度和实用性。原创 2025-08-03 10:39:00 · 35 阅读 · 0 评论 -
9、基于子空间聚类的差分依赖挖掘方法
本文介绍了一种基于子空间聚类的差分依赖(DD)挖掘方法,通过引入自由-最大β-n簇的概念,提出了一种新的高效挖掘算法SCAMDD。该方法通过挖掘子空间中的簇结构,生成候选差分函数(DF),并进一步挖掘有效的差分依赖关系,最终通过剪枝策略得到最小覆盖集。实验表明,SCAMDD在严格约束条件下具有良好的性能,适用于数据质量修复、数据挖掘与分析等领域。研究还探讨了参数设置对算法性能的影响,并提出了未来应用的方向和优化建议。原创 2025-08-02 14:21:09 · 73 阅读 · 0 评论 -
8、材料属性预测与数据依赖挖掘技术解析
本博文围绕材料属性预测与数据依赖挖掘两大主题展开。第一部分介绍了可扩展高斯过程回归(Scalable GPR)在预测材料电导率中的应用,展示了其在不同测试点数量下的实验表现,分析了预测误差的影响因素,并总结了该方法在效率和可扩展性方面的优势。第二部分探讨了基于子空间聚类的差分依赖挖掘方法,通过定义差分依赖(DD)及其有趣性度量,提出了一种高效的挖掘算法,有效减少了搜索空间并提高了挖掘质量。最后,博文对两种方法进行了实验分析,并展望了未来的研究方向,包括数据质量优化、算法改进和应用拓展等。原创 2025-08-01 16:40:08 · 42 阅读 · 0 评论 -
7、可扩展高斯过程回归在材料属性预测中的应用
本文提出了一种可扩展的高斯过程回归(Scalable GPR)算法,用于解决传统GPR在处理大规模材料属性预测任务时计算成本过高的问题。通过批量查询处理、训练数据凝聚和查询感知训练数据选择三个阶段,可扩展GPR在保持预测准确性的前提下显著提升了计算效率。该方法在马氏体开始温度(Ms)预测和电导率预测两个实际应用中表现出色,尤其在处理大规模数据集和实时预测任务中展现了明显优势。实验结果表明,与传统GPR、神经网络和支持向量机(SVM)相比,可扩展GPR在效率和可扩展性方面具有更强的优势,适合需要快速响应的实际原创 2025-07-31 10:17:02 · 46 阅读 · 0 评论 -
6、OLAP安全规范模型与可扩展高斯过程回归技术解析
本文深入解析了OLAP安全规范模型(OSSM)和可扩展高斯过程回归(Scalable GPR)技术。OSSM提供了一种定义安全策略的逻辑和语法,支持声明性语言扩展和编程API集成,适用于数据安全管理场景。而Scalable GPR则通过三步策略优化传统GPR的计算效率,适用于材料属性预测和实时应用领域。文章还详细介绍了两种技术的核心概念、实现步骤及实际应用案例,展示了它们在各自领域的应用价值。原创 2025-07-30 09:20:19 · 46 阅读 · 0 评论 -
5、道路网络与OLAP系统的高效查询及安全策略
本文探讨了道路网络中的高效查询与OLAP系统的安全策略两个研究方向。在道路网络中,重点研究了聚合最远邻(AkFN)查询问题,提出了扁平搜索和层次搜索算法,结合层次聚类和预计算方法,提高了查询效率。针对OLAP系统,提出了OLAP安全规范模型(OSSM),基于面向对象的概念,构建了主体、对象和角色的多维安全策略模型,并设计了策略管理框架。文章通过实验对比验证了算法的有效性,并通过示例和框架实现展示了OSSM模型的应用价值。原创 2025-07-29 12:43:22 · 28 阅读 · 0 评论 -
4、道路网络上高效聚合最远邻查询处理
本文研究了在道路网络上高效处理聚合最远邻(AkFN)查询的问题。通过引入层次聚类和预计算网络距离边界的方法,提出了两种高效的搜索算法——扁平搜索(FS)和层次搜索(HS)。实验评估基于真实世界的北京道路网络和POI数据集,结果表明层次搜索算法在各种实验条件下均优于穷举搜索和扁平搜索,能够显著提高查询处理效率。研究结果可应用于地理信息系统、交通规划和物流配送等领域。原创 2025-07-28 13:16:51 · 82 阅读 · 0 评论 -
3、实时实体解析与道路网络查询的高效索引技术
本文介绍了两种高效的索引技术,用于解决实时实体解析和道路网络中的聚合最远邻居查询问题。动态排序邻域索引(DySNI)和基于相似性的SimDySNI通过优化候选记录集生成和预计算相似性,显著提升了实时实体解析的效率。针对道路网络查询,提出了一种三阶段解决方案,包括聚类、网络距离边界预计算和高效搜索算法,有效减少了网络距离评估的次数。实验结果表明,这些技术在大型数据集上具有良好的性能和应用前景。原创 2025-07-27 12:45:52 · 22 阅读 · 0 评论 -
2、实时实体解析的动态排序邻域索引技术
本文介绍了一种基于编织AVL树的动态排序邻域索引技术(DySNI)及其改进版本SimDySNI,用于解决动态数据库中的实时实体解析问题。通过动态索引构建和自适应窗口生成方法,DySNI能够在保持高效查询性能的同时生成高质量的候选记录集。SimDySNI则进一步引入了相似度预计算机制,显著减少了查询时的计算开销。实验结果表明,DySNI和SimDySNI在插入时间、查询时间和匹配准确性方面均优于现有实时匹配技术,为实时实体解析提供了高效且准确的解决方案。原创 2025-07-26 09:29:53 · 38 阅读 · 0 评论 -
1、25th 澳大拉西亚数据库会议(ADC2014):数据库领域的知识盛宴
25th澳大拉西亚数据库会议(ADC2014)在澳大利亚布里斯班成功举办,会议汇聚了全球数据库领域的研究人员和从业者,展示了最新的研究成果与创新应用。会议涵盖投稿评审、特邀演讲、PhD学校项目等多个环节,重点探讨了数据库理论、应用和技术的前沿问题,并为年轻研究者提供了学习和交流平台。ADC2014在推动数据库领域的发展、促进国际合作与技术创新方面发挥了积极作用,为未来研究方向提供了重要启示。原创 2025-07-25 09:06:24 · 43 阅读 · 0 评论
分享