深度学习基础入门
1. 引言
深度学习是机器学习领域中备受关注的概念,无论是学术界还是媒体都对其十分关注。神经网络以及深度学习的灵感来源于人类大脑(或其他有大脑的生物)的生物结构。
感知机的设计受到生物神经元的启发,它连接多个输入(类似于树突接收信号),将这些输入进行组合和累积(如同细胞体的功能),并产生一个类似轴突的输出信号。神经网络进一步拓展了这一概念,它将多个人工神经元连接成网络,神经元之间通过突触传递信息。每个神经元学习输入的不同函数,使得整个神经网络具有极其多样的表示能力。
在过去的6 - 7年里,深度学习的普及和应用呈指数级增长。尽管神经网络的基础可以追溯到20世纪60年代末,但AlexNet架构在2012年的ImageNet图像分类竞赛中,凭借5层卷积神经网络轻松获胜,引发了人们对深度学习的极大兴趣。从那时起,深度学习被应用于众多领域,并在大多数领域取得了最先进的性能。
本文的目的是向读者介绍深度学习。读者在阅读完本文后,应能够理解神经网络的基础知识以及如何训练它们。我们将从回顾感知机算法开始,它是神经网络的起源。接着引入多层感知机(MLP)分类器,它是前馈神经网络最简单的形式。之后讨论训练MLP的关键组件,包括前向传播和反向传播,并解释神经网络的整体训练过程。然后探索神经网络的基本架构组件,如激活函数、误差度量和优化方法。最后,将MLP概念扩展到深度学习领域,介绍训练深度神经网络时的额外考虑因素,如计算时间和正则化,并对常见的深度学习框架方法进行实际讨论。
2. 感知机算法详解
深度学习的最简单形式是感知机算法的演变,通过基于梯度的优化器进行训练。感知机算法是最早的监督学习算法之一,可追溯到20世纪5
超级会员免费看
订阅专栏 解锁全文
36万+

被折叠的 条评论
为什么被折叠?



