Task04:详读西瓜书+南瓜书第5章

本文介绍了神经元模型,包括M-P神经元模型和激活函数,详细阐述了感知机的工作原理、损失函数及随机梯度下降法。接着,讨论了误差逆传播算法(BP算法)在神经网络中的应用,以及全局最小与局部极小的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

5.1 神经元模型

在这里插入图片描述
这是生物上神经元的一个作用。

M-P精神元模型

1943年,Miculloch和Pitts受到生物神经网络启发,将生物上的神经元情形抽象,提出了机器学习中的“M-P神经元模型”。如图所示
在这里插入图片描述
在这个模型中,神经元接收到来自 n 个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接(connection)进行传递,神经元接收到的总输入值将与神经元的阀值进行比较,然后通过"激活函数" (activation function) 处理以产生神经元的输出。

①这里的xi就表示来自第i个神经元的输入。这个神经元会收到n个来自其他神经元传递过来的输入信号。与前面线性回归中一个样例有n维属性相同。
②每一个输入进来的信号都有相应的权重w,因此输入进来n个输入的时候。就会计算出一个加权和在这里插入图片描述

③神经元会有一个阈值。加权和与阈值比较在这里插入图片描述

④通过激活函数处理产生神经元的输出,也就是f()

激活函数

M-P神经元模型最理想的激活函数是阶跃(sgn)函数,它将神经元输入值与阈值的差值映射为输出值“0”或“1”。

然而阶跃函数不连续,不光滑,故在M-P神经元模型中,实际是采用Sigmoid函数来作为激活函数的, Sigmoid函数将较大范围内变化的输入值挤压到 (0,1) 输出值范围内,所以也称为挤压函数(squashing function)。

事实上在对数几率回归那里我们也是使用sigmoid函数代替了阶跃函数。
它们的图形如图所示
在这里插入图片描述

5.2 感知机

感知机是由两层神经元组成的。
输入层接收外界输入信号后传递给输出层。
输出层是一个M-P神经元。
显然,输出层会输出激活函数处理后的y值
在这里插入图片描述

感知机(模型)

感知机模型:使用的激活函数是sgn(阶跃函数)的神经元
显然,其结果会输出0或1,属于分类任务在这里插入图片描述

损失函数(策略)

在这里插入图片描述
我们希望错误集合的值最小。也就是求损失函数的最小值。
在这里插入图片描述

随机梯度下降法(算法)

区分梯度下降法和随机梯度下降法
梯度下降法;是对所有样本求梯度
随机梯度下降法:是随机挑选一个样本进行梯度下降
感知机学习算法使用的是随机梯度下降法
步骤1:首先对损失函数求偏导,得
在这里插入图片描述
步骤2:一次随机选取一个误分类点使其梯度下降。更新权重:
在这里插入图片描述
相应地, 中的某个分量 的更新公式即为西瓜书公式(5.2),最终解出来的 通常不唯 一。
在这里插入图片描述

5.3 误差逆传播算法(BP算法)

神经网络

在这里插入图片描述
在这里插入图片描述

BP算法

在这里插入图片描述
步骤:
1.计算输出层误差
2.误差反向传播
3.更新权重值和阈值在这里插入图片描述

全局最小与局部极小

局部极小:参数空间中的某个点,其领域点的误差函数值均不小于该点的函数值;
全局最小:参数空间中所有点的误差函数值均不小于该点的误差函数值;
实际上我们求得的都是局部最小点。求出的该点也无法直接判断。而是通过在测试集中进行测试而观察该点的情况。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值