深度学习基础入门
1. 深度学习简介
深度学习是近年来机器学习领域中备受关注的概念,无论是学术界还是媒体都对其投入了大量的关注。神经网络以及深度学习的灵感来源于人类大脑(或其他有大脑的生物)的生物结构。
感知机(Perceptron)的设计受到生物神经元的启发。生物神经元接收多个输入信号(类似于树突接收信号),在细胞体中对这些输入进行组合和累积,最后通过轴突输出信号。感知机也有多个输入,每个输入有对应的权重,经过组合和处理后产生一个输出。
神经网络进一步拓展了这个概念,它将多个人工神经元连接成网络,信息在神经元之间传递(类似于生物神经元之间的突触连接)。每个神经元学习输入的不同函数,使得整个神经网络具有极其多样化的表示能力。
在过去的6 - 7年里,深度学习的 popularity 和应用呈指数级增长。虽然神经网络的基础可以追溯到20世纪60年代末,但AlexNet架构在2012年的Imagenet图像分类竞赛中,凭借一个5层卷积神经网络轻松获胜,引发了人们对深度学习的极大兴趣。从那以后,深度学习被应用于众多领域,并在大多数领域取得了最先进的性能。
本文的目的是向读者介绍深度学习。通过阅读本文,读者应该能够理解神经网络的基础知识以及如何训练它们。我们将从回顾感知机算法开始,它是神经网络的起源。然后介绍多层感知机(Multilayer Perceptron,MLP)分类器,这是前馈神经网络最简单的形式。接着讨论训练MLP的基本组件,包括前向传播和反向传播,并解释神经网络的整体训练过程。之后,我们将探索神经网络的基本架构组件,如激活函数、误差度量和优化方法。最后,我们将MLP的概念扩展到深度学习领域,介绍训练深度神经网络时的额外考虑因素,如计算
超级会员免费看
订阅专栏 解锁全文
36万+

被折叠的 条评论
为什么被折叠?



