7、全连接深度网络：原理、训练与挑战

transformer2023

于 2025-10-31 10:18:28 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：从零开始掌握深度学习文章标签：全连接深度网络反向传播通用逼近定理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/transformer2023/article/details/154669847

从零开始掌握深度学习专栏收录该内容

18 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

全连接深度网络：原理、训练与挑战

1. 全连接深度网络基础

全连接深度网络由一系列全连接层构成，每个全连接层是一个从 ℝm 到 ℝn 的函数，其每个输出维度都依赖于每个输入维度。以下是全连接层的数学表示：
设 x ∈ℝm 为全连接层的输入，yi ∈ℝ 为该层的第 i 个输出，则：
[y_i = \sigma(w_1x_1 + \cdots + w_mx_m)]
其中，σ 是非线性函数（可先将其视为之前章节介绍的 sigmoid 函数），wi 是网络中的可学习参数。完整的输出 y 为：
[y =
\begin{bmatrix}
\sigma(w_{1,1}x_1 + \cdots + w_{1,m}x_m) \
\vdots \
\sigma(w_{n,1}x_1 + \cdots + w_{n,m}x_m)
\end{bmatrix}
]
为提高效率，通常将 y 计算为矩阵乘法：
[y = \sigma(wx)]
这里，sigma 是 ℝn × m 矩阵，非线性函数 σ 按元素应用。

全连接网络中的节点通常被称为“神经元”，这一命名源于历史。20 世纪 40 年代，Warren S. McCulloch 和 Walter Pitts 提出大脑的数学模型，认为神经元能对布尔量进行任意函数计算。后来的研究者将数学“神经元”改进为连续函数，当输入足够大时“激发”（取值为 1），否则静止。但真实的神经元极其复杂，与人工神经元有很大差异。

2. 全连接网络的学习与理论

反向传播学习 ：最

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。