基于机器学习的油棕基腐病分类研究
1. 不平衡处理方法
在本次研究中,采用了RUS、ROS和SMOTE重采样技术来处理数据不平衡问题,使用开源机器学习应用程序WEKA进行重采样。重采样参数在分类前确定,具体参数如下表所示:
| 不平衡处理方法 | 技术 | 参数 |
| — | — | — |
| 数据采样 | RUS | distributionSpread = 1 |
| | ROS | biasToUniformClass = 1,noReplacement = false |
| | SMOTE | classValue = 0,nearestNeighbors = 5,percentage = 50 |
为了测试,将数据集划分为70%的训练数据和30%的测试数据。非感染和BSR感染树木的数据集预处理技术如下表所示:
| | 训练 | | 测试 | |
| — | — | — | — | — |
| | 非感染(多数类) | BSR感染(少数类) | 非感染(多数类) | BSR感染(少数类) |
| 单一(无数据不平衡处理) | 38 | 25 | 17 | 12 |
| RUS | 25 | 25 | 12 | 12 |
| ROS | 31 | 31 | 14 | 14 |
| SMOTE | 38 | 38 | 17 | 17 |
2. 实验评估
2.1 时间时段选择
使用双向方差分析(ANOVA)评估油棕树的状态(非感染和感染BSR)和时段(上午和下午)对平均温度的主效应及其交互效应。结果表明,状
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



