数据增强技术在爆破诱导相关问题中的应用
1. 数据分类
在机器学习(ML)模型的开发中,确保模型的泛化能力是一项关键任务。为了实现这一目标,需要从原始数据集中选择一部分数据样本用于训练 ML 模型,其余数据样本用于验证所开发的 ML 模型。
在本次研究中,将整个数据的 80%(131 个数据样本)指定为训练数据集,其余 20%(33 个数据样本)指定为测试数据集。训练集和测试集的一些统计指标如下表所示:
| 符号 | 单位 | 训练集范围 | 训练集均值 | 训练集标准差 | 测试集范围 | 测试集均值 | 测试集标准差 |
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
| HL | m | (8.0, 28.4) | 19.282 | 5.514 | (7.0, 28.0) | 18.209 | 5.803 |
| BS | – | (0.486, 0.913) | 0.754 | 0.097 | (0.5, 0.909) | 0.769 | 0.09 |
| St | M | (1.5, 4.0) | 2.884 | 0.604 | (1.4, 3.9) | 2.835 | 0.662 |
| PF | kg/m³ | (0.24, 0.98) | 0.692 | 0.196 | (0.27, 0.95) | 0.674 | 0.202 |
| MC | kg | (74.78, 309.09) | 204.373 | 63.655 | (69.79, 301.61) | 191.612 | 65.578 |
| NH | – | (22, 60)
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



