监督模型与循环网络:原理、应用与稳定性分析
1. 线性衰减正则化
在监督模型中,存在一种特殊的正则化方法。当误差函数 $E$ 关于某个权重的导数为零时,该权重会线性衰减至零,并在有限时间内达到该值。只有当误差函数 $E$ 关于某个权重的导数的绝对值大于 $A$ 时,这个权重才能避免归零。
这种正则化项 $E_{r}$ 具有双重作用:一方面,它作为正则化器,倾向于使权重保持较小的值;另一方面,它又像一个剪枝器,会自动将最不重要的权重设为零。由于上述原因,这种正则化形式被称为线性衰减,也可称为拉普拉斯正则化,因为在统计框架下,通过假设权重具有拉普拉斯先验可以证明其合理性。
不过,使用这种正则化方法时需要注意,当权重为零时,正则化项 $E_{r}$ 关于权重是不可微的。一种处理方法是在每次训练步骤中,检查每个权重是否改变了符号,如果改变则将其设为零。若 $|\frac{\partial E}{\partial w_{ji}}| > A$,则允许该权重在后续训练步骤中脱离零值。
除了这种正则化方法外,还有其他一些方法可用于寻找具有良好泛化能力的网络,例如基于 Vapnik - Chervonenkis 维度(通常简称为 VC 维度)的方法。
2. 多层感知器的应用示例
多层感知器在众多不同的应用领域有着广泛的应用,以下是一些具体的应用示例:
- 编码器问题 :一个具有 $m$ 个输入和 $m$ 个输出的网络,被训练在由 $m$ 个模式组成的空间中执行恒等映射,即输出模式与相应的输入模式相等。这些模式是通过将其中一个分量设为 1,其余分量设为 0 得到的。网络采用的拓扑结构
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



