深度学习模型的训练涉及几个方面:
− 模型结构 模型有几层、每层多少通道数等等
− 数据集 用什么数据训练模型:数据集划分、数据文件路径、数据增强策略等等
− 训练策略 梯度下降算法、学习率参数、batch_size、训练总轮次、学习率变化策略等等 − 运行时 GPU、分布式环境配置等等
− 一些辅助功能 如打印日志、定时保存checkpoint等等
深度学习模型的训练涉及几个方面:
− 模型结构 模型有几层、每层多少通道数等等
− 数据集 用什么数据训练模型:数据集划分、数据文件路径、数据增强策略等等
− 训练策略 梯度下降算法、学习率参数、batch_size、训练总轮次、学习率变化策略等等 − 运行时 GPU、分布式环境配置等等
− 一些辅助功能 如打印日志、定时保存checkpoint等等