1.与用于图像分类的全连接的DNN相比,CNN有什么优势?
与全连接的DNN相比,CNN的主要优势在于图像分类。
因为连续的层仅部分连接并且由于其大量复用权重,所以CNN的参数比全连接的DNN少得多,这使其训练速度快得多,降低了过拟合的风险,并且需要的训练数据也少得多。
CNN学会了可以检测到特定特征的内核后,便可以在图像中的任何位置检测到该特征。相反,当DNN在一个位置学习某个特征时,它只能在该特定位置检测到它。由于图像通常具有非常重复的特征,因此对于CNN而言,使用较少的训练实例,可以比DNN更好地泛化图像处理任务(例如分类)。
最后,DNN没有像素的排列方式的先验知识。它不知道附近的像素很近。CNN的架构嵌入了此先验知识。较低的层通常在图像的较小区域中标识特征,而较高的层将较低层的特征组合为较大的特征。这对大多数自然图像都能很好地工作,从而使CNN与DNN相比具有领先优势。
2.计算CNN参数和占用RAM
问:考虑由三个卷积层组成的CNN,每个卷积层具有3×3内核,步幅为2和"same"填充。最低层输出100个特征图,中间层输出200个特征图,最顶层输出400个特征图。输入图像是200×300像素的RGB图像。CNN中的参数总数是多少?