神经网络回归与TensorFlow估计器详解
1. 模型测试结果分析
在模型测试中,对小、中、大三种不同规模的模型进行了运行测试,每次运行的结果都会有所不同,以下是某次运行的结果:
| 模型类型 | MSE | MAE | 未见过数据的葡萄酒质量预测 | 可训练参数 |
| ---- | ---- | ---- | ---- | ---- |
| 小模型 | 0.6353 | 0.6149 | 5.6185 | 209 |
| 中模型 | 0.6351 | 0.6231 | 5.2464 | 9153 |
| 大模型 | 0.5520 | 0.5552 | 5.3894 | 51201 |
从表格数据可以看出,损失和平均绝对误差(MAE)最初会降低,但对于较大的模型,后期会呈现较高的值,不过差异较小。同样,对未见过数据的预测也几乎在相同范围内。同时,增加模型的复杂度会导致过拟合。而可训练参数从209急剧增加到51201。由此可以得出结论,在小数据集的简单回归情况下,使用小模型是可行的。
2. 神经网络与深度学习解决回归问题的要点
- 数据预处理 :当有多个不同范围的数值特征时,在数据预处理阶段要确保每个特征独立缩放到相同范围。
- 模型选择 :如果数据不足,使用具有少量隐藏层的小网络以避免过拟合。
- 损失函数与评估指标 :在回归项目中,常用均方误差(MSE)作为损失函数,平均绝对误差(MAE)作为评估指标。但
tf.keras <
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



