人工神经网络:预测误差、权重更新与过拟合问题解析
1. 预测误差与权重的关系
在分析预测误差与权重的变化关系时,我们发现不像某些简单方程(如 (Y = X^2Z + H) 计算 (\frac{\partial Y}{\partial X}) 那样直接,预测误差和权重之间没有直接的方程联系。因此,我们采用多元链式法则来求解相关偏导数。
预测误差基于特定公式计算,但该公式中没有直接涉及权重。不过,预测输出是基于Sigmoid函数计算的,而变量 (s)(SOP)的计算依赖于权重,其计算公式为:
[s = X_1 * W_1 + X_2 * W_2 + b]
为了了解预测误差随权重的变化情况,我们需要进行一些中间操作,具体涉及四个中间偏导数:
- (\frac{\partial E}{\partial Predicted})
- (\frac{\partial Predicted}{\partial s})
- (\frac{\partial s}{\partial W_1})
- (\frac{\partial s}{\partial W_2})
通过将这些偏导数相乘,我们可以得到预测误差相对于每个权重的变化关系:
[\frac{\partial E}{\partial W_1} = \frac{\partial E}{\partial Predicted} * \frac{\partial Predicted}{\partial s} * \frac{\partial s}{\partial W_1}]
[\frac{\partial E}{\partial W_2} = \frac{\part
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



