3、基于高斯分布的高效数据流分类规则提取方法

基于高斯分布的高效数据流分类规则提取方法

在数据流分类领域,如何高效处理连续属性一直是一个重要的研究方向。本文将介绍一种基于高斯分布的规则提取方法,旨在提高规则提取的计算效率,同时保持较高的分类准确性。

1. eRules分类器及其规则归纳方法

eRules分类器主要有三个核心过程:
- 批量模式学习规则 :使用Prism算法在第一批传入的数据实例上学习初始规则集。若后续实例未被当前规则集覆盖,则将其添加到缓冲区。当缓冲区中的实例数量达到用户定义的阈值时,使用Prism算法从这些实例中诱导新规则,并清空缓冲区。
- 添加新规则 :每当从缓冲区生成新规则时,将其添加到当前规则集,以适应数据流中出现的新概念。
- 验证和移除现有规则 :如果所学规则与当前概念不再相关(即发生概念漂移),eRules会将其从模型中移除。这通过规则的分类准确性随时间的下降来量化。

2. 当前基于条件概率的规则项归纳方法

原始的Prism方法仅适用于处理分类数据以诱导规则项 (α = v)。而eRules和VFDR算法能够处理连续属性,但处理方式有所不同。eRules生成的规则项形式为 (α < v) 或 (α ≥ v),VFDR生成的规则项形式为 (α ≤ v) 或 (α > v)。eRules处理连续属性的步骤如下:
1. 按属性值对数据集进行排序。
2. 对于连续属性α的每个可能值v,计算目标类对于 (α < v) 和 (α ≥ v) 两个规则项的概率。
3. 返回对目标类总体概率最高的规

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值