数据挖掘算法与数据库系统性能对比分析
在数据挖掘和数据库管理领域,算法和系统的性能至关重要。本文将介绍一种新型分类算法EXPLORE,并对对象数据库管理系统(ODBMS)和对象关系数据库管理系统(ORDBMS)在不同对象复杂度下的性能进行比较。
EXPLORE:新型决策树分类算法
EXPLORE是一种对See5进行改进的新型分类算法。其主要改进在于提升提取有趣模式的能力,这些模式通常会被现有算法遗漏。
- 模式提取能力 :EXPLORE能够直接捕捉涉及数值窗口的模式,例如图5中Leaf 13到Leaf 16是图2中Leaf 8的扩展。通过选择较低的UGR阈值,图2中的Leaf 8还可进一步拆分或扩展。该算法能快速涉及少量节点来找到这些模式,无需用户进行仔细研究。
- 与其他算法的对比 :通过对表3的仔细观察,在提取高质量模式(逻辑规则)方面,EXPLORE表现优于现有树算法。See5、REPTree和J48分别位居第二、第三和第四。在简单性方面,当EXPLORE明显优于REPTree和See5时,J48可能与EXPLORE表现相似。在分类准确性上,EXPLORE与See5并列第二。此外,EXPLORE提取的显著规模模式数量最多。
- 评分机制与结论 :为了总结比较结果,根据表3中的每个因素为算法分配分数。表现最佳的算法得4分,最差得1分,第二和第三最佳分别得3分和2分。如果两个算法并列最佳,则都得4分,下一个最佳算法得2分。根据这些因素,EXPLORE总得分最高(37分),明显优于其他三个算法(分别为23分、23分和17分)。
超级会员免费看
订阅专栏 解锁全文
690

被折叠的 条评论
为什么被折叠?



