李宏毅2022ML第三周课程笔记-优快云博客

本文链接：https://blog.youkuaiyun.com/snajdansa/article/details/127737577

本文详细介绍了李宏毅2022年机器学习第三周课程中关于卷积神经网络(CNN)的内容。文章阐述了使用CNN的原因，包括如何避免过拟合以及如何利用共享参数检测图像中的特定模式。此外还详细解释了CNN的架构，包括卷积层、池化层的作用及操作方式，并说明了如何将特征映射展平为一维向量以便进一步处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

李宏毅2022ML第三周课程笔记（三）-- CNN

为什么使用CNN？

卷积

Convolution和fully connected layer的关系。

池化

Flatten

李宏毅2022ML第三周课程笔记（三）-- CNN

为什么使用CNN？

一张图片是一个三维的tensor，如果使用全连接神经网络架构，由于其参数过多，模型的弹性很大，很容易overfitting，所以可能不需要一个fully-connected。

同时，我们需要观察的对象往往不需要观察整个图，也有可能一张图内有多个我们需要观察的对象，这时我们可以使用相同的neural和同样的参数可以把同一模块侦测出来。

接下来介绍CNN的架构：首先input一张image以后，这张image会通过convolution layer，接下来做max pooling这件事，然后再做convolution，再做max pooling这件事。这个process可以反复无数次，反复的次数你觉得够多之后，(但是反复多少次你是要事先决定的，它就是network的架构(就像你的neural有几层一样)，你要做几层的convolution，做几层的Max Pooling，你在定neural架构的时候，你要事先决定好)。你做完决定要做的convolution和Max Pooling以后进行flatten，再把flatten的output放入一般的fully connected feedforward network，然后得到影像辨识的结果。