从AlexNet开始(一)
不可否认,深度学习的热潮正是由2012年AlexNet的出现而引发的,因此,学习AlexNet网络的结构,对于CNN的学习与理解是不可或缺的。在本篇博客中,将会对AlexNet的论文进行翻译与解读,并在下一篇博客中试图使用ALexNet的网络构建思想去建立一个简单的CNN模型用来对CIFAR-10数据集进行分类。
AlexNet论文题目:
ImageNet Classification with Deep Convolution Neural Networks
Prologue 序言
在序言的第一句,Alex就是一句长长的吐槽,吐槽Yann LeCun大佬的论文被CV的顶会拒收了仅仅因为Yann LeCun使用了神经网络。事实上,在那个时代,神经网络是一种被研究机器学习的大佬们所看不起的算法模型,那时人们认为计算机视觉系统需要充分理解任务的类型并由人对系统进行细致地调整,而仅仅简单地输入大量图片与标签,利用神经网络对数据进行特征归纳与分类的方法是行不通的。
在序言的最后,Alex说出了一句非常经典的话:
For deep neural networks to shine, they needed far more labeled data and hugely more computation.
这句话也正是神经网络和Deep Learning经过数十年的发展终于迎来井喷式发展的原因——互联网带来的海量数据与半导体行业的高速发展。