高效“炼丹”必备技能：一文实现深度学习数学原理入门，还有吴恩达老师亲授课程...

转载于 2020-12-24 12:41:48 发布 · 246 阅读

·

0

·

文章标签：

#神经网络 #算法 #人工智能 #深度学习 #机器学习

部署运行你感兴趣的模型镜像

贾浩楠发自凹非寺
量子位报道 | 公众号 QbitAI

哪个程序员不想高效“炼丹”？

尤其是深度学习算法开发人员，追求模型结构优化和提高编程效率是永远的目标。

但是，如果只做代码“搬运工”，不了解神经网络背后的数学原理，很难对项目有深刻全面的理解，debug反而会更难、耗时更长。

就以深度学习中常用的神经网络来说，典型模型包括多层感知机(DLP)、卷积神经网络(CNN)、循环神经网络(RNN)等等，不同的项目，对神经网络的调参需求也不相同。

下面的深度学习数学基础详解，以DLP为例，你读完后会对它的数学基础有全面的了解，并且熟悉用数学解释算法的基本思路。

除了DLP，文末还一并为你准备了RNN、CNN数学原理，以及吴恩达老师的AI数学基础课程。

一文实现AI数学基础入门，还在等什么？

多层感知机的数学表达

多层感知机的数学表达分为4个部分：学习算法、参数初始化、激活函数、优化函数。

学习算法

神经网络的学习过程可以看做是参数的权重在网络中经历的不同回归，也就是说我们的算法是要找出一个使参数得到最佳输出的回归方法，由此我们定义一个目标函数：损失函数L（loss function）；还有一个参数J，它是训练集真实与估计值的量化表示。

我们通过正向和反向传播两种方法来使J最小化，学习算法可以表示为：
正向传播：

其中m是训练集的大小，i是参数在网络中的迭代次数，y是模型的输出，θ是模型参数。

反向传播：

参数初始化

零初始化：使所有参数的权重和偏差都为零。

随机初始化：不断将随机噪音赋值给参数。如果噪音过大，可能会造成某些激活函数溢出，并影响到后续的梯度计算。

Xavier方法：取值于正态分布的中心变量：

Glorot方法：同样取值于正态分布，方法不同。

激活函数

激励函数的功能是选择在网络中被传递的具体参数，更深一层的理解是，允许网络中被有效激活的神经元传递训练数据。

一下是一些常用的激活函数：

优化函数

风险，是神经网络中全部数据集的损失，是我们需要优化的对象，定义为：

其中，X是一个可观测的连续空间中，与Y有关的元素，p(X,Y)是在这一空间中观察到点（X,Y）的边缘概率。

经验风险

在没有全部数据集，或全部数据集过大的情况下，我们不考虑参数分布情况，仅将风险估计的范围限定在一个有代表性的数据集上，这种情况下，损失函数可以表示为：

m是代表数据集的大小。

于是可以得出：

梯度下降法

我们需要构造一个可微凸函数J，其任何一个局部的最小值都是整个函数的最小值，那么求这个函数的最小值就相当于解一个方程∇J(θ)=0，设它的解为θ⋆，于是我们得到：

学习率递减

实践证明，随着数据迭代次数增加，模型会逐渐降低学习率。现在已经有许多成熟地描述学习率递减的公式。

优化函数还包含输入优化、网络数据丢失正则化、反向传播正则化等，限于篇幅将链接放在文末。

其他有关深度学习的数学基础的参考链接

DLP中的其他优化函数，以及参数正向、反向传播时损失函数详细推推导过程
https://www.ismailmebsout.com/deep-learning/

除了DLP，其他神经网络RNN、CNN等也有详细的数学表达推导过程
CNNhttps://www.ismailmebsout.com/Convolutional%20Neural%20Network%20-%20Part%201/
RNNhttps://www.ismailmebsout.com/recurrent-neural-networks/

deep learning数学基础入门
http://deeploria.gforge.inria.fr/cours/cours1.html#/definitions

Deep Learning Specialization. Master Deep Learning, and Break into AI，吴恩达
https://fr.coursera.org/specializations/deep-learning

Antoine Henrot的优化算法课程
http://www.iecl.univ-lorraine.fr/~Antoine.Henrot/english.html

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

AI落地最佳参考！

2020中国人工智能年度评选结果揭晓

12月16日，量子位MEET 2021智能未来大会现场，50大领航企业、10大明星创业公司、30大商业领军人物、10大最佳产品、10大最佳解决方案、5大社会责任榜样、5大最佳技术社区等年度奖项悉数颁出。

点击图片查看完整榜单：

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

您可能感兴趣的与本文相关的镜像

Wan2.2-T2V-A5B

Wan2.2-T2V-A5B

文生视频

Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型，是有50亿参数的轻量级视频生成模型，专为快速内容创作优化。支持480P视频生成，具备优秀的时序连贯性和运动推理能力

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。