李宏毅2022机器学习笔记（5）——CNN

最新推荐文章于 2025-03-31 07:15:00 发布

hyy_ssdlh

最新推荐文章于 2025-03-31 07:15:00 发布

阅读量126

点赞数

文章标签：机器学习笔记 cnn

本文链接：https://blog.youkuaiyun.com/weixin_47416620/article/details/131971832

版权

将一张映像输入到模型中，得到该映像的类别，其中y向量中每一个值代表该映像是该类型的可能性。

图片如何输入？

在电脑中，一个彩色图片由三个通道组成（RGB），将该向量写开，则向模型组输入该向量

要对图像特征进行观察，定义一些显著的特征，从而识别出图像的实体。neuro负责判断其对应的patterns是否出现。

在CNN中每个neuro有一个自己的receptive field，每个neuro只负责自己receptive field中的事情。

例如上图将neuro负责的receptive field展开成一个 3*3*3的向量，将该27位向量作为输入进行处理，并将输出给下一层。

receptive field可以有重叠，多个neuro可守卫同一个receptive field。receptive field大小可以不一，可以任意设计

最经典的all channels

超出边界外的叫做padding,超出部分补数。整张图，每个地方都被receptive field扫过

在不同的图像中，同样的pattern可能出现在图片的不同区域。neuro在对数据的处理时所作的操作都是相同的，不同的是所守卫的receptive field不同。每个receptive field并不需要都有一个对应pattern的neuro，只需要共享参数便可以解决这个问题。

如下图，两个neuro共享参数，即两个neuro的w完全一致。虽然两个neuro完全一致，但因为输入不同会得到不同的输出

因此不能让两个receptive field完全一致的neuro共享参数。

Fully connected layer会观察整个图像，加入receptive field后限制了neuro的弹性，neuro加入参数共享后会变成convolutional layer，此时model bias会更大，但model bias大不一定是件坏事。当model bias较小，model的灵活度太高时，更容易overfitting的情况。

Fully connected layer灵活度高，可以做各种事情各种变化。convolutional layer灵活度低，专门为图像设计，在图像处理上会做更好。