11、机器学习:从数据处理到模型应用的全面指南

机器学习:从数据处理到模型应用的全面指南

1. 预测物种与特征影响

在进行物种预测时,涉及到预测物种和实际物种的对比。预测物种包括 Floribunda (White)、Rosa kordesii (Red)、Rosaceae (Blue) ,实际物种情况如下表所示:
| 实际物种 | 相关数据 |
| — | — |
| Rosaceae (Blue) | 0, 0, 41 |
| Floribunda (White) | 53, 4, 0 |
| Rosa kordesii (Red) | 0, 45, 0 |

同时,有四个特征对结果的影响百分比分别为:
- Leaf Length (mm):9.3581%
- Leaf Width (mm):3.2167%
- Stem length (mm):43.2882%
- Stem width (mm):44.1370%

完成随机森林的学习后,接下来将探讨如何处理需要预处理的不完美数据。

2. 处理不平衡数据集

不平衡类别的数据会使“准确性”指标失效,这在机器学习(特别是分类问题)中是一个常见问题,出现在各类别观测值比例失调的数据集中。标准准确性不再能可靠地衡量性能,这让模型训练变得更加棘手。

2.1 目标变量的分类

目标变量有三个类别:
- R(右重):当 var3 ∗ var4 > var1 ∗ var2
- L(左重):当 var3 ∗ var4 < var1 ∗ var2
- B(平衡):当 var3 ∗

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值