李沐-动手学深度学习-多层感知机的实现

最新推荐文章于 2025-04-10 22:16:54 发布

啥都想学点的研究生

最新推荐文章于 2025-04-10 22:16:54 发布

阅读量716

点赞数 2

文章标签： cnn 人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_60678226/article/details/125073506

版权

本文详细介绍了多层感知机（MLP）的工作原理，包括其结构、激活函数的作用，以及三层模型的具体表达。通过实例展示了如何构建带一个隐藏层的MLP，重点讲解了ReLU激活函数的实现。此外，文章还涵盖了模型的训练过程，以及使用高级API进行简洁实现的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

多层感知机的从零开始实现

1. 多层感知机（MLP）原理简介

多层感知机（MLP，Multilayer Perceptron）也叫人工神经网络（ANN，Artificial Neural Network），除了输入输出层，它中间可以有多个隐层，最简单的MLP只含一个隐层，即三层的结构，如下图：

从上图可以看到，多层感知机层与层之间是全连接的。多层感知机最底层是输入层，中间是隐藏层，最后是输出层。

隐藏层的神经元怎么得来？首先它与输入层是全连接的，假设输入层用向量X表示，则隐藏层的输出就是 f (W1X+b1)，W1是权重（也叫连接系数），b1是偏置，函数f 可以是常用的sigmoid函数或者tanh函数：

注：神经网络中的Sigmoid型激活函数：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。