H2O 模型训练参数与方法详解
1. 早停法与交叉验证结合
当早停法与交叉验证结合使用时,它会在每个交叉验证模型上应用早停标准。之后,会计算出最优的树数量或训练轮数(epochs),并在不使用早停法的情况下构建最终模型。不过,如果模型质量在每次运行时随机波动较大,有时可能会得到奇怪的结果。
2. 检查点(Checkpoints)
检查点是 H2O 一个非常实用的功能。假设你花 10 分钟训练一个神经网络,测试后发现比只训练 5 分钟的模型有了提升,你可能想知道训练 15 分钟会怎样。传统方式可能需要 30 分钟才能了解这三个阶段的情况。而使用 H2O 的检查点功能,你可以先训练 5 分钟,停止并测试,再接着训练 5 分钟得到近似 10 分钟训练的模型,最后再训练 5 分钟得到 15 分钟训练的模型,同样的三个模型,时间却缩短了一半。
涉及的两个变量如下:
- model_id :模型的名称。如果未指定,会随机生成一个。建议在使用 H2O 进行任何重要工作时,都设置 model_id,这样便于在 Flow 中查找模型,或者在磁盘上找到保存的模型。POJOs 也会根据 model_id 命名。不过,不要在 model_id 中放入过多信息,否则其作用会降低。如果想放入超过三个参数,或许可以考虑直接给模型起个名字,如 “DL:extra - deep” 等。
- checkpoint :前一个模型的 ID(该模型必须当前在你的 H2O 集群上),作为新模型训练的起点。
检查点的工作方式是,定义一个新模型,使用相同的参数(通常情况),但增加训练轮数(
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



