目录
计算机视觉是深度学习应用的主要方向之一,一般的CV问题包括三类:图像分类,目标识别记忆风格转换,传统神经网络处理CV问题时网络权重W非常大,会造成神经网络结构复杂,易过拟合,同时所需的内存计算量极大,解决方法就是使用卷积神经网络。
1 边缘检测
神经网络解决CV问题实际上就是从浅层到深层,先检测边缘特征,局部特征,然后检测出整体面部轮廓的过程。
常见的图片边缘有两类,分别是垂直边缘和水平边缘。

我们可以通过与滤波器(也就是卷积核)进行卷积来实现对边缘的检测,以垂直边缘检测为例,图片尺寸为6x6,滤波器尺寸为3x3,卷积后的图片尺寸为4x4,下图表示为:

深度学习中的卷积操作就是和卷积核对应位置元素相乘再求和,上图只显示了了卷积后的第一个和最后一个值。
下图是一个检测垂直边缘的例子

上图中使用的卷积核是一个典型的垂直边缘检测算子,上图可以看出最右边图中明亮部分就是垂直边缘的位置。
图片边缘有两种改变方式,一种是由明变暗,另一种是由暗变明,其实本质上都是检测边缘

上图从左至右由明变暗,也就是卷积图像中图像为明;另一种由暗变明则是卷积图像中图像为暗。
上面使用的都是垂直边缘的例子,很显然还有水平边缘检测的算子

除了简单的水平垂直边缘检测还有别的常用卷积核,比如例如Sobel filter和Scharr filter。这两种滤波器的特点是增加图片中心区域的权重。
卷积神经网络详解:从边缘检测到深度学习应用

本文介绍了卷积神经网络的基础知识,包括边缘检测、padding、卷积步长、三维卷积、单层卷积神经网络、池化层以及CNN的应用案例。卷积操作用于检测图像边缘,padding和步长调整输出尺寸,三维卷积处理RGB图像,池化层减少计算量并提高模型稳定性。卷积神经网络通过参数共享和连接的稀疏性,有效解决了传统神经网络的过拟合问题,并在计算机视觉任务中表现出色。
最低0.47元/天 解锁文章
1270

被折叠的 条评论
为什么被折叠?



