基于C4.5神经网络集成

最新推荐文章于 2024-09-11 23:31:30 发布

poilkj110

最新推荐文章于 2024-09-11 23:31:30 发布

阅读量816

点赞数 1

分类专栏：决策树文章标签：神经网络

本文链接：https://blog.youkuaiyun.com/poilkj110/article/details/78674984

版权

决策树专栏收录该内容

1 篇文章

订阅专栏

最近Hinton提出使用决策树来解释神经网络。看到周志华老师04年论文，遂做点笔记
原文：NeC4.5: Neural Ensemble Based C4.5
决策树具有很好的理解能力，神经网络集成具有很好的泛化能力。本文将两者融合到一个新的决策树算法Nec4.5。该算法首先训练一个神经网络集成。然后训练的集成被用来生成新的训练集，通过用由训练的集成的输出替代原始训练样本的期望标签，一些额外训练样本也从训练集成中生成并被加入到新的训练集中。最后一个C4.5算法从新的数据集中训练得到。
一般而言，决策树具有很好的理解能力因为学到的知识能在书中精确表达出来，然而神经网络因为学到的知识被隐藏地编码在一系列连接中所以很难理解。
所以网络集成组合了许多神经网络，它的行为就更难理解。本文提出基于C4.5的神经网络集成，可被视为C4.5算法的变形，其中一个神经网络集成被用来预处理训练数据。
2 NeC4.5
假设训练集 $S = \{(x_1, y_1), (x_2, y_x),\cdot\cdot\cdot, (x_l, y_l)\}$ .一个神经网络集成从S中训练得到。这里使用Bagging 来训练集成，其使用bootstrap 取样来生成多种训练集合从原始训练集，然后从每个生成的训练集中训练神经网络。当然也可以使用不同集成学习方法。
对于每个特征向量 $x_i (i = 1, 2, \cdot\cdot\cdot, l)$ 当它输入到一个训练的神经网络集成N* 后输出一个类别标签 $y_i'$ . 通过使用 $y_i'$ 代替yi，得到一个新的样本 $(x_i, y_i')$ 。重复此过程得到新的训练集合 $S' = \{(x_1, y_1'), (x_2, y_2'),\cdot\cdot\cdot, (x_l, y_l')\}$ , 这样所有的特征向量在S中出现也在S’中出现。
S’可以通过包含额外训练数据（其由神经网络集成生成）来扩大。通过随机生成一些特征向量然后将其输入到训练的集成中。对于每个随机生成的特征向量 $x_j' (j =1,2, \cdot\cdot\cdot, m)$ ，当它输入到N*中会输出一个类别标签 $y_l'$ . 那么得到样本 $(x_j', y_j')$ 。通过额外数据比率来控制额外训练数据， $\mu=m/l$ , m表示额外训练集中样本个数，l表示原始训练集大小。