机器学习中的模型容量、正则化与人工神经网络设计
在机器学习领域,模型的性能和效果受到多个关键因素的影响,包括模型容量、正则化以及人工神经网络(ANN)的设计等。下面我们将详细探讨这些方面的内容。
1. 模型容量与复杂度
模型容量/复杂度指的是模型能够处理的变化程度。容量越高,模型能应对的变化就越多。例如,与模型 (y_4) 相比,模型 (y_1) 的容量较小。在多项式模型中,多项式的次数越高,模型容量越大。
多项式方程的次数越高,对数据的拟合效果通常越好,但同时也会增加模型的复杂度。使用容量过高的模型可能会导致过拟合,即模型在训练数据上表现出色,但在未见过的数据上表现不佳。机器学习的目标是创建一个不仅对训练数据,而且对未见过的数据样本都具有鲁棒性的模型。
以 (y_4) 模型为例,它非常复杂,虽然能很好地拟合已见数据,但对未见数据的表现较差。因为 (y_4) 中新增的特征 (x_4) 捕捉了过多不必要的细节,使得模型过于复杂,所以我们可以考虑去除该特征,回到三次多项式方程 (y_3)。虽然 (y_3) 对已见数据的拟合不如 (y_4) 完美,但通常对未见数据的性能更好。
在实际工作中,我们可能不知道要去除哪些特征,或者不想完全去除某个特征,而只是想对其进行惩罚。这时可以通过修改损失函数来实现。例如,为了最小化 (Θ_4x_4) 这一项,我们可以最小化 (Θ_4)。如果 (x_4) 是一个非常糟糕的特征,我们可以将 (Θ_4) 设为 0;如果 (x_4) 是一个相对较好的特征,我们可以将 (Θ_4) 设为接近 0 的值(如 0.1),以限制其影响。
以下是修改损失函数的相关公式:
- 修改损失函数以惩罚 (x_3
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



