从二元和连续数据训练的神经网络中演化规则
在数据挖掘领域,分类规则的挖掘是一项重要任务。本文将介绍一种从训练好的神经网络中提取可理解规则的新算法,该算法考虑了所有输入属性,并能高效地从神经网络中提取规则。
1. 神经网络输入向量与规则提取基础
连续向量 $X_2$ 的长度等于 $K$,因此人工神经网络(ANN)的输入向量 $Y$ 可以表示为:
[
Y = X_1 + X_2
]
输入向量 $Y$ 的长度由以下公式确定:
[
m = b + s + K
]
数据分类按照特定方法进行,得到如下函数:
[
C(Y)=\frac{1}{1 + \sum_{j = 1}^{k} e^{-(y_{i}w_{ij}+\theta_{i})}}\left(1+\sum_{j = 1}^{s} e^{-(v_{j}+\xi_{j})}\right)
]
规则提取时,优化过程会产生长度为 $s$ 的向量,每个向量代表一条规则。要查看这些规则,需要对向量进行解码。以提取属于类别 0 或类别 1 的规则为例,最佳抗体的解码步骤如下:
1. 将最佳抗体的二进制部分划分为 $L$ 个段。
2. 每个段代表一个属性 $A_n$($n = 1,2,\cdots,L$),并且具有相应的位长度 $m_n$ 来表示其值。
3. 如果最佳抗体中相应的位等于 1,则属性值存在,反之则不存在。
4. 将最佳抗体的连续部分从归一化形式转换,然后通过加减标准差得到区间。
5. 使用“OR”和“AND”运算符分别关联同一属性和不同属性的现有值。
超级会员免费看
订阅专栏 解锁全文
966

被折叠的 条评论
为什么被折叠?



