概念漂移下的块集成比较与交通旅行时间估计
在数据处理和分析领域,概念漂移和旅行时间估计是两个重要的研究方向。本文将介绍概念漂移下不同块集成分类器的比较,以及基于浮动车数据的旅行时间估计模型。
概念漂移下的块集成分类器
1. 自适应分类器集成(ACE)
ACE 是一种结合了显式在线漂移检测器的块集成系统。它由一个在线学习器、多个批量学习器和一个漂移检测机制组成。漂移检测器使用比例的置信区间来定义适当的漂移阈值。当最佳假设的适用性低于置信区间的下限或高于上限时,系统认为发生了概念漂移。
ACE 系统的工作流程如下:
- 当有新的学习示例时,更新在线分类器并将该示例存储在缓冲区中。
- 如果漂移检测器发出变化信号或缓冲区中的示例数量超过最大大小,则使用缓冲区中的示例创建一个新的批量学习器。
- 新的基分类器构建完成后,擦除在线学习器和内存缓冲区。
- ACE 不重新训练批量学习器,而是使用加权多数投票组合在线学习器和组件分类器的预测。
2. 实验设置
为了比较不同的分类器,选择了 6 种不同的分类器进行实验:
- 3 种基于块的集成:AWE、带 BDDM 的 BWE 和 ACE。
- 一个批量版本的 Gama’s DDM。
- 带批量版本 DDM 的 BWE。
- 两个单分类器:带标准 DDM 的决策树(WEKA J48)和带批量版本 DDM 的相同树分类器。
实验使用了 9 个不同的数据集,包括 3 个真实数据集和 6 个人工数据集,涵盖了不同类型的变化,如渐进漂移、突然漂移、异常值和稳定期。选择了三种不同的块大小:5
超级会员免费看
订阅专栏 解锁全文
1201

被折叠的 条评论
为什么被折叠?



