目录
计算机视觉是深度学习应用的主要方向之一,一般的CV问题包括三类:图像分类,目标识别记忆风格转换,传统神经网络处理CV问题时网络权重W非常大,会造成神经网络结构复杂,易过拟合,同时所需的内存计算量极大,解决方法就是使用卷积神经网络。
1 边缘检测
神经网络解决CV问题实际上就是从浅层到深层,先检测边缘特征,局部特征,然后检测出整体面部轮廓的过程。
常见的图片边缘有两类,分别是垂直边缘和水平边缘。
我们可以通过与滤波器(也就是卷积核)进行卷积来实现对边缘的检测,以垂直边缘检测为例,图片尺寸为6x6,滤波器尺寸为3x3,卷积后的图片尺寸为4x4,下图表示为:
深度学习中的卷积操作就是和卷积核对应位置元素相乘再求和,上图只显示了了卷积后的第一个和最后一个值。
下图是一个检测垂直边缘的例子
上图中使用的卷积核是一个典型的垂直边缘检测算子,上图可以看出最右边图中明亮部分就是垂直边缘的位置。
图片边缘有两种改变方式,一种是由明变暗,另一种是由暗变明,其实本质上都是检测边缘
上图从左至右由明变暗,也就是卷积图像中图像为明;另一种由暗变明则是卷积图像中图像为暗。
上面使用的都是垂直边缘的例子,很显然还有水平边缘检测的算子
除了简单的水平垂直边缘检测还有别的常用卷积核,比如例如Sobel filter和Scharr filter。这两种滤波器的特点是增加图片中心区域的权重。