机器学习中的数值预测与黑盒方法
1. 数值数据预测——回归方法
在数值数据预测方面,我们主要探讨了回归树和模型树两种方法,以葡萄酒质量预测为例进行说明。
1.1 回归树分析
回归树通过对数据进行划分来进行数值预测。例如,在葡萄酒质量预测中,所有 3750 个样本从根节点开始,根据酒精含量(alcohol)进行首次划分,其中 2372 个样本酒精含量小于 10.85,1378 个样本酒精含量大于等于 10.85。由于酒精含量在树中首先被使用,所以它是预测葡萄酒质量最重要的单一因素。
以下是部分回归树节点信息:
|节点编号|条件|样本数量|某种统计值|预测值|是否为叶节点|
| ---- | ---- | ---- | ---- | ---- | ---- |
|8|volatile.acidity >= 0.3025|688|278.97670|5.255814|是|
|9|volatile.acidity < 0.3025|923|505.04230|5.563380|是|
|5|volatile.acidity < 0.2275|761|447.36400|5.971091|是|
|3|alcohol >= 10.85|1378|1070.08200|6.328737|否|
|6|free.sulfur.dioxide < 10.5|84|95.55952|5.369048|是|
|7|free.sulfur.dioxide >= 10.5|1294|892.13600|6.391036|是|
|14|alcohol < 1
超级会员免费看
订阅专栏 解锁全文
2545

被折叠的 条评论
为什么被折叠?



