最近一直在学习目标检测,计算机视觉的一个重要领域。而cnn是现在语音分析和图像识别的一个研究重点,它的共享权值策略不仅降低了网络模型的复杂度,也减少了训练的权值的数量。
CNN网络的训练
第一阶段,向前传播阶段:
a)从样本集中取一个样本(X,Yp),将X输入网络;
b)计算相应的实际输出Op。
在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是计算(实际上就是输入与每层的权值矩阵相点乘,得到最后的输出结果):
Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))
第二阶段,向后传播阶段
a)算实际输出Op与相应的理想输出Yp的差;
b)按极小化误差的方法反向传播调整权矩阵
本文主要介绍LeNet5,Alexnet,Googlenet,VGG
LeNet5:
是用于手写字体识别的一个经典CNN,曾用于银行签名识别。