机器学习数据模型探索
1. 基尼指数与决策树相关概念
1.1 基尼指数基础
基尼指数在元素同质(纯)时达到最小值。若 $p_i = 1$ 或 $p_i = 0$,则基尼指数 $Gini = 1 - 1 - 0 = 0$。
以一个包含五个特征的任意数据集为例,特征 E 为预测特征,有正、负两类,且两类实例数量相等以简化计算。
| Index | A | B | C | D | E |
|---|---|---|---|---|---|
| 1 | 4.8 | 3.4 | 1.9 | 0.2 | positive |
| 2 | 5 | 3 | 1.6 | 1.2 | positive |
| 3 | 5 | 3.4 | 1.6 | 0.2 | positive |
| 4 | 5.2 | 3.5 |
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



