1.图像处理
较为底层的操作,可以看成数据预处理(图像本身也是由像素数据组成的),常见的处理有:图像降噪,压缩,提升分辨率,边缘检测等
彩色图像灰度化
边缘检测:检测出图像中亮度变化显著的点,这种变化由灰度值的一阶导数来体现,在实际操作中用差分来代替。
2.基于深度学习的图像识别
主要是基于卷积神经网络cnn,来提取特征,lenet,resnet,Alexnet.
图像识别的三个阶段:
分类------->检测-------->分割
分类
识别图像中的目标属于哪一类,图像中没有其他目标
检测
定位+分类
先将图像中的各个目标框出来,然后再进行分类
分割
描绘出各个目标的轮廓
3.end to end 模型(目标检测)
输入的是原始数据,得到结果。
input----->cnn网络------->结果
目标检测中one stage方法就是端到端的,
比如yolo,ssd
two stage
RPN(region proposal network)提出候选框
RPN+CNN
4.FPN特征金字塔网络
论文地址:https://arxiv.org/pdf/1612.03144.pdf