神经网络（二）—— 线性神经网络

最新推荐文章于 2023-04-15 10:52:10 发布

木子六日

最新推荐文章于 2023-04-15 10:52:10 发布

阅读量454

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习/深度学习文章标签：神经网络 python 深度学习机器学习

本文链接：https://blog.youkuaiyun.com/Paul_1i/article/details/104103562

机器学习/深度学习专栏收录该内容

22 篇文章

订阅专栏

本文深入探讨了线性神经网络的概念，对比感知机，解释了为何改变激活函数为purelin函数y=x，以及如何通过最小化代价函数进行权值迭代。并通过δ学习规则详细展示了线性神经网络的异或问题解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

线性神经网络

介绍

线性神经网络和感知机的区别不大，只是把激活函数由y=sign(x)变成了purelin函数y=x。

为什么要改激活函数呢？

感知机是通过误分类点来不断修改权值，这样会导致最终的超平面虽然的确完成了分类的任务，但是它未必分的那么‘平均’。

我们希望那些已经正确分类的点也会对权值产生影响。

感知机那块我们的目的是找出合适的权值w，使得最终sign(wx)的值与实现给定的y值一样，就算训练完了。

但是现在不是y=sign(x)了，而是y=x，那怎么办呢？

$δ\delta$ 学习规则

wx的值虽然可能无法和y一模一样，但是我们可以让它最小。
$E=\frac12(y_预-y_真)^2=\frac12(f(wX)-y)^2$
就是让代价函数E最小。

w的迭代函数就是
$w:=w-\eta \frac{\partial E}{\partial w}$
我们来求下导可以得到
$E'=X^T(f(wX)-y)f'(wX)$
将 $(f (w X) - y) f^{'} (w X)$ 就成为 $δ\delta$ （delta）。

对于y=x而言，显然 $δ\delta$ 为f(wX)-y。
$w:=w-\eta X^T(f(wX)-y)$
没错和感知机那块是一样的，但 f(wX)-y 可不是只有2或-2两种结果了。

线性神经网络解决异或问题

直线肯定是分不开的，我们用曲线，策略和多项式回归一样，多加几个非线性项。

异或有两个特征a和b，我们就把 $a^2$ ， $b^2$ ， $a b$ 这三列加上看成单独的特征即可。

# encoding:utf-8
import numpy as np
import matplotlib.pyplot as plt

# 输入数据(加入偏置和非线性项)
X = np.array([[1,0,0,0,0,0],
              [1,0,1,0,0,1],
              [1,1,0,1,0,0],
              [1,1,1,1,1,1]])
Y = np.array([-1,1,1,-1])

# 初始化权值
W = (np.random.random(6)-0.5)*2

# 学习率、迭代次数、输出临时变量
lr = 0.1
n = 0
O = 0

# 权值的更新函数
def update():
    global X,Y,W,lr,n
    n+=1
    O = np.dot(X,W)
    W_C = lr*(X.T.dot(Y-O))/int(X.shape[0])
    W = W + W_C

for i in range (1000):
    update()
    
# 正样本
x1=[0,1]
y1=[1,0]
# 负样本
x2=[0,1]
y2=[0,1]

# 二次方程w0+w1*x1+w2*x2+w3*x1*x1+w4*x1*x2+w5*x2*x2=0已知w和x1求x2
def calculate(x,root):
    a = W[5]
    b = W[2] + x*W[4]
    c = W[0] + x*W[1] + x*x*W[3]
    if root==1:
        return (-b+np.sqrt(b*b-4*a*c))/(2*a)
    if root==2:
        return (-b-np.sqrt(b*b-4*a*c))/(2*a)

xdata = np.linspace(-1,2)

# 画图
plt.scatter(x1,y1,c='b')
plt.scatter(x2,y2,c='g')
plt.plot(xdata,calculate(xdata,1),'r')
plt.plot(xdata,calculate(xdata,2),'r')
plt.show()