重新思考-全连接层
多层感知机的局限性:
参数太多:处理图像时,参数量巨大,导致计算复杂度高。
不利于表达空间结构:多层感知机会破坏图像的空间结构信息。
难以反映平移不变性:无法有效处理图像中的平移不变性问题。
难以表征抽象层级:无法有效提取图像中的浅层和高层特征。
猫狗分类
使用一个还不错的相机采集RGB图片(3600万个像素)使用 100 个神经元单隐含层的 MLP ,模型有 36 亿个参数远超过地球上的狗和猫的数量
使用卷积神经网络可大大降低参数量:共享参数机制、多种池化方法
两个原则
平移不变性
不管检测对象出现在图像中的哪个位置,神经网络的前面几层都应该对相同的图像区域具有相似的反应。
局部性
神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔较远的区域的关系。