线性神经网络

最新推荐文章于 2023-04-15 10:52:10 发布

数据科学家修炼之道

最新推荐文章于 2023-04-15 10:52:10 发布

阅读量269

点赞数

分类专栏： AI # 深度学习 # Sklearn笔记 # TensorFlow笔记

本文为博主原创文章，欢迎转载，转载请注明出处。

本文链接：https://blog.youkuaiyun.com/xiligey1/article/details/81406950

版权

AI 同时被 3 个专栏收录

130 篇文章

订阅专栏

55 篇文章

订阅专栏

TensorFlow笔记

23 篇文章

订阅专栏

线性神经网络

线性神经网络和单层感知器的区别主要在于：感知器的传输函数只能输出两种可能的值，而线性神经网络可以输出任意值，其传输函数是线性函数

线性神经网络结构图
如图所示，线性神经网络可以产生二值输出(图中的 $q$ )和模拟输出(图中的 $y$ )

和感知器类似，先行神经网络的变量：
$x(n)=[1, x_1(n),x_2(n),...,x_N(n)]^T$
$w(n)=[b(n),w_1(n),w_2(n),...,w_N(n)]^T$
$b(n)=偏置$
$y(n)=实际输出=f(x(n)^Tw)=x(n)^Tw$
$d(n)=期望输出$
$\eta=学习率，0<\eta<1$
激活函数 $f=purelin$ (线性函数 $y=x$ )

LMS算法

线性神经网络的闪光之处在于其学习算法LMS。LMS算法只能训练单层网络。

第n次迭代的信号误差

e (n) = d (n) - x T (n) w (n)

$e(n)=d(n)-x^T(n)w(n)$
对

w w $w$ 求偏导可得

\frac{\partial e (n)}{\partial w} = - x^{T} (n)

$\frac {\partial e(n)} {\partial w}=-x^T(n)$
代价函数

E (w) = 1 2 e 2 (n)

$E(w)=\frac 1 2 e^2(n)$
对

w w $w$ 求偏导可得

\frac{\partial e (n)}{\partial w} = e (n) \frac{\partial e (n)}{\partial w}

$\frac {\partial e(n)} {\partial w}=e(n)\frac {\partial e(n)} {\partial w}$
综上可得

\partial E \partial w = - x T (n) e (n)

$\frac {\partial E} {\partial w}=-x^T(n)e(n)$
因此，根据梯度下降法

w (n + 1) = w (n) + η (- \nabla) = w (n) + η (- \partial E \partial w) = w (n) + η x T (n) e (n)

$w(n+1)=w(n)+\eta (-\nabla)=w(n)+\eta(-\frac {\partial E} {\partial w})=w(n)+\eta x^T(n)e(n)$

LMS算法中学习率的选择

确保收敛的学习率

1996年Hayjin证明只要学习率 $\eta$ 满足

0 < η < 2 λ m a x

$0<\eta<\frac 2 {\lambda_{max}}$ LMS算法就是按方差收敛的。其中

λmax λ m a x $\lambda_{max}$ 是输入向量

x(n) x ( n ) $x(n)$ 组成的自相关矩阵

R R $R$ 的最大特征值。由于

λ_{m a x}

$\lambda_{max}$ 常常不可知，往往用

R R $R$ 的迹来代替

t r (R) = \sum_{i = 1}^{Q} R (i, i)

$tr(R)=\sum_{i=1}^QR(i,i)$
同时，矩阵的迹等于所有特征值之和，因此

tr(R)>λmax t r ( R ) > λ m a x $tr(R)>\lambda_{max}$
只要取

0<η<2tr(R)<2λmax 0 < η < 2 t r ( R ) < 2 λ m a x $0<\eta<\frac 2 {tr(R)}<\frac 2 {\lambda_{max}}$ 即可满足条件。
按定义，自相关矩阵的主对角线元素之和就是各输入向量的均方值，因此公式又可以写成

0 < η < 2 向 量 均 方 值 之 和

$0<\eta<\frac 2 {向量均方值之和}$

学习率逐渐下降

学习初期，用较大的学习率保证收敛速度，随着迭代次数增加，减小学习率保证精度，确保收敛。
- $\eta=\frac {\eta_0} {n}$
- $\eta=c^n\eta_0,c接近1但小于1$
- $\eta=\frac {\eta_0} {1+\frac n \tau}, n_0和\tau均为常数$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。