原理分析:
决策树
- 信息增益

- 信息增益算法

- 信息增益比

- 生成决策树(c4.5算法)

代码分析:
决策树
(1)加载数据
①读取数据,分割放入列表
②将label值二值化,>=5为1,<5为0
③将data值二值化,=0的为0,不等于0的为1
④放入矩阵中
|
(2)求最优特征:计算信息增益比 ①计算特征数 =Train_label.shape[1] ②计算信息熵HD 统计每个特征的label值,在进行运算
|
本文深入探讨了使用决策树模型对MNIST数据集进行分类的方法。介绍了决策树的基础,如信息增益、信息增益比以及C4.5算法,并通过详细代码分析展示了数据预处理和模型构建的步骤。
决策树




决策树
(1)加载数据
①读取数据,分割放入列表
②将label值二值化,>=5为1,<5为0
③将data值二值化,=0的为0,不等于0的为1
④放入矩阵中
|
(2)求最优特征:计算信息增益比 ①计算特征数 =Train_label.shape[1] ②计算信息熵HD 统计每个特征的label值,在进行运算
|
6622

被折叠的 条评论
为什么被折叠?