一.什么是深度学习。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
二.深度学习的整体流程。
- 接收读取数据(数据的类型可以是图片,声音等等)
- 搭建一个模型(搭建模型需要借助神经网络)
- 迭代训练(使模型更符合我们的要求,一般来说更接近真实的情况)
- 使用模型(比如判断一个物体是什么之类的)
三.深度学习的三要素。
- 数据的准备与处理(数据的干净程度)
- 网络结构
- 损失函数
数据的准备与处理涉及两个方面。
一是对数据进行0均值化,数据归一化,PCA和白化。
二是对数据进行扩增。增强数据的多样性。
网络结构由多个单元和函数所组成。一般情况下,越复杂的网络结构使用的函数和单元就越多,适用的范围就越广。
损失函数涉及到拟合问题,也就是通过损失函数反馈的数据不断调整模型,使得模型按照我们预期的方向发展。
四.神经网络的超参数。
- 学习率。学习率是指机器对变量自主调节的幅度的倍数(或者说大小),一般情况下,学习率越小效果越好,当然得到结果所需要的次数就越多,运行时间也越长。
- epoch。一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程。由于一个epoch常常太大,计算机无法负荷,我们会将它分成几个较小的Batches。
- Batchsiza。Batch就是每次送入网络中训练的一部分数据,而Batch Size就是每个batch中训练样本的数量。 <