权重衰减(weight-decay) 权重衰减 方法 高维线性回归实验 从零开始实现 初始化模型参数 定义 L 2 L_2 L2范数惩罚项 定义训练和测试 观察过拟合 使用权重衰减 简洁实现 小结 权重衰减 上一节中我们观察了过拟合现象,即模型的训练误差远小于它在测试集上的误差。虽然增大训练数据集可能会减轻过拟合,但是获取额外的训练数据往往代价高昂。本节介绍应对过拟合问题的常用方法:权重衰减(weight decay)。 方法 权重衰减等价于 L 2 L_2 L<