steps:训练迭代的总次数。一步计算一批样本产生的损失,然后使用该值修改一次模型的权重。
batch size:单步的样本数量(随机选择)。例如,SGD 的批次大小为 1。
以下公式成立:
periods:控制报告的粒度。例如,如果 periods 设为 7 且 steps 设为 70,则练习将每 10 步输出一次损失值(即 7 次)。与超参数不同,我们不希望您修改 periods 的值。请注意,修改 periods 不会更改模型所学习的规律。
以下公式成立:
steps:训练迭代的总次数。一步计算一批样本产生的损失,然后使用该值修改一次模型的权重。
batch size:单步的样本数量(随机选择)。例如,SGD 的批次大小为 1。
以下公式成立:
periods:控制报告的粒度。例如,如果 periods 设为 7 且 steps 设为 70,则练习将每 10 步输出一次损失值(即 7 次)。与超参数不同,我们不希望您修改 periods 的值。请注意,修改 periods 不会更改模型所学习的规律。
以下公式成立: