深度学习模型训练与实验:街车延误预测案例
1. 深度学习模型训练基础
1.1 关键参数与模型结构
在深度学习中,定义损失函数和输出激活函数的参数至关重要。对于这些参数的选择以及适用的问题类型,有相关资料进行了详细介绍。
深度学习模型的代码虽然看似简单,但却是整个解决方案的核心,它能将原始数据集转化为训练好并可部署的模型。在使用结构化数据集训练深度学习模型之前,必须确保训练模型所使用的所有列在评分时都可用。若使用在预测时无法获取的数据进行训练,可能会使模型在训练阶段表现过于乐观,但在实际应用中却无法做出有用的预测。
Keras 深度学习模型需要以 numpy 数组列表的形式进行训练,因此需要将 Pandas 数据框转换为 numpy 数组列表。TensorFlow 和 Keras 最初是独立但相关的项目,从 TensorFlow 2.0 开始,Keras 成为了 TensorFlow 的官方高级 API,其推荐库也被打包为 TensorFlow 的一部分。
1.2 模型构建与探索
街车延误预测模型使用 Keras 函数式 API,它兼具易用性和灵活性。该模型的层会根据列的类别(连续、分类和文本)自动生成。
嵌入是从自然语言处理领域借鉴的强大概念,它将向量与非数值值(如分类列中的值)关联起来。使用嵌入的好处包括能够像处理常见数值操作一样处理非数值值,在解决有监督学习问题的过程中对分类范围内的值进行无监督学习式的分类,以及避免独热编码的缺点。
可以使用多种方法来探索 Keras 深度学习模型,如 model.summary() (表格视图)、
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



