训练模型的更多实验
在之前的模型训练中,我们已经完成了深度学习模型的训练,并进行了一系列实验来评估和提升其性能。接下来,我们将开展一组额外的实验,聚焦于验证模型的两个关键方面:去除不良值(这是数据准备阶段的一个步骤)和为分类列添加嵌入层。之后,我们还会进行一个实验,对比使用深度学习方法和非深度学习方法(XGBoost)解决有轨电车延误预测问题的效果。
1. 实验相关代码
当你克隆相关的GitHub仓库(http://mng.bz/v95x)后,会在 notebooks 子目录中找到与实验相关的代码。以下是本章实验所用到的文件列表:
| 目录/文件 | 说明 |
| — | — |
| data | 存放中间数据集的目录 |
| models | 保存训练好的模型的目录 |
| notebooks | |
| custom_classes.py | 包含管道类的定义 |
| streetcar_model_training.ipynb | 包含数据集重构和深度学习模型训练代码的笔记本 |
| streetcar_model_training_xgb.ipynb | 包含数据集重构和XGBoost模型训练代码的笔记本 |
| streetcar_model_training_config.yml | 模型训练的配置文件,定义超参数值、训练/验证/测试比例等配置参数 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



