15、深度学习基础入门

深度学习基础入门

1. 深度学习概述

随着机器学习问题变得越来越复杂,参数空间的地形也变得更加多样化,通常是非凸的,存在许多局部最小值。简单的梯度下降方法可能难以学习特定的函数。因此,人们将多层神经元连续堆叠,并使用反向传播进行联合训练。这样的层网络可以学习多个非线性函数,以拟合训练数据集。深度学习指的是多个神经网络层按顺序连接。

“深度学习”这个术语有些模糊。在很多情况下,它是神经网络的一个新名称,或者指具有多个连续(深层)层的神经网络。然而,区分深层网络和浅层网络的层数是相对的。一般来说,深层网络仍然是神经网络(通过反向传播进行训练,学习输入的分层抽象,并使用基于梯度的学习进行优化),但通常具有更多的层。深度学习的显著特点是它能应用于传统方法和小型神经网络难以解决的问题。

神经网络的灵活性使其非常有吸引力。由于反向传播和基于梯度的优化方法简单有效,神经网络被应用于许多类型的问题。接下来,我们将介绍影响深度神经网络(DNN)架构设计和模型训练的其他方法和注意事项,重点关注激活函数、损失函数、优化方法和正则化方法。

2. 激活函数

在计算输出层的梯度时,阶跃函数在计算梯度方面并不实用,因为其导数处处为 0,这使得梯度下降方法失效。因此,我们需要使用在反向传播过程中能提供有意义导数的非线性激活函数。以下是一些常见的激活函数:

2.1 Sigmoid 函数

Sigmoid 函数的表达式为:
[
\sigma(x) = \frac{1}{1 + e^{-x}}
]
它是一个连续的压缩函数,将输出限制在 (0, 1) 范围内。它类似于阶跃函数,但具有平滑连续的导

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值