深度学习——单层感知器从原理到实践

最新推荐文章于 2024-02-15 20:22:19 发布

wjsjason

最新推荐文章于 2024-02-15 20:22:19 发布

阅读量4.1k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/luroujuan/article/details/85225244

本文介绍了单层感知器的工作原理，包括其数学模型、损失函数和梯度下降法。通过具体例子解释了如何通过梯度下降调整权重W，使得损失函数L减小。接着展示了使用sigmoid激活函数时的权重更新公式，并提供了代码实践，展示训练过程及结果。通过调整学习率和迭代次数，可以观察到不同的训练效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

单层感知器

首先我们从人工神经网络第一次兴起的单层感知器谈起。

1.工作原理

感知器（perceptron），有的也称其为感知机，是人工神经网络中最基础的网络结构（perceptron一般特指单层感知器，而多层感知器一般被称为MLP）。

下图给出了一种单层感知器的模型，可以用公式表示为

其中X代表向量[x1,x2,…,xn,1]，W代表向量[w1,w2,…,wn,b]，σ代表激活函数。

对于一组输入值X，我们期望该网络的输出值为Y，而实际输出值为y，则我们定义损失函数（或者称为代价函数、目标函数）L为：

其中的X和Y都是已知值，可见L是关于W的函数。如果我们通过改变W，使得L等于0或者无线趋近于0，则此时可以认为网络的输出值y就等于期望值Y。那么如何更改W呢？一种方法是梯度下降法：先确定一个初始值，然后将W沿着梯度下降的方向进行调整，就会使得L的值向更小的方向进行变化。

为了更直观的理解，我们将上式中的X看做一个数3，Y也是一个数9，σ函数为y=x。则

用图像表示L与W的关系如下图

初始值W为w0=6，此时L值为40.5。而在w0处的梯度值d（导数值）为-3*(9-3w0)=27，则沿着梯度下降方向调整到w1处，w1= w0-0.1*d=3.3，将w1代入求得L为0.405。可见L的值

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。