在当今工业和在线应用中,实时数据流中的异常检测至关重要。传统监督学习方法面临标注成本高、数据分布动态变化的挑战。亚马逊科学团队在ICML 2025提出的SEAD框架创新性地解决了这些问题。
核心创新点:
- 动态集成机制:SEAD集成多个基础检测器,根据其异常报告"保守程度"动态调整权重。采用乘性权重更新(MWU)机制,对持续输出高异常分的模型自动降权。
- 无监督适应性:通过分位数归一化处理不同检测器的评分体系,无需标注数据即可适应数据分布变化。测试显示即使加入随机检测器,准确率仅下降0.88%。
- 在线计算优化:SEAD++通过概率采样将计算速度提升2倍,资源消耗显著降低。
技术架构:
- 权重更新公式:wt+1i=wti⋅exp(−η⋅sti)w_{t+1}^i = w_t^i \cdot \exp(-\eta \cdot s_t^i)wt+1i=wti⋅exp(−η⋅sti),其中η\etaη为学习率,stis_t^isti为归一化异常分
- 采用15个异构检测器组成的集成系统,在真实场景中能快速识别并淘汰持续误报的模型(如图中橙色曲线模型)
性能表现:
- 在15项任务测试中平均排名5.07(最佳)
- 方差6.64(最低)
- 计算效率比基准方法提升2倍
该方法为电商风控、工业设备监控等实时流数据处理场景提供了新的技术解决方案。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
公众号二维码