一、深度学习在图像领域的几大任务:
1.任务分类:
(a)图像分类 eg:ResNet (判断有或者无)
(b)目标检测 eg:Faster-RCNN (强调物体含义,可识别目标物体的位置和类别 ,返回的是标签+概率)
(c)语义分割 eg:FCN (强调类别含义,能够识别像素的类别,分辨出是前景和背景)
(d)实例分割 eg:Mask-RCNN (对同一类别的不同目标也用不同 颜色来区分, 只关注目标,不关注背景)
2.目标检测的实现:
(a)分类网络是基础:
常见的分类网络有: Alex Net、VGG、inceptionv1(Googlenet)、ResNet、WRN、SqueezeNet、 Xception、MobilieNet、ShuffleNet、DenseNet、SENet等等。
(b)目标检测网络可分为:
一阶段(One Stage):速度快 eg:SSD、Yolo 基于anchors直接进行分类以及调整边界框
两阶段(Two Stage):监测更准确 eg:Faster-RCNN
1)通过专门的模块去生成候选框FPN 寻找前景(需要检测的目标)以及调整边界框(基于生成的anchors)
2)基于之前生成的候选框进一步分类以及调整边界框(基于proposals)
二、YOLO算法的基本思想是:
首先通过特征提取网络提取输入特征,得到特定大小的特征图输出。输入图像分成13×13的网格单元,接着如果真实框中某个对象的中心坐标落在某个网格中,那么就由该网格来预测该对象每个对象有固定数量的边界框,YOLO v3中有三个边界框,使用逻辑回归确定用来预测的回归框。
三、Yolov3网络实现血液淋巴细胞识别:
总体实验步骤如下:
(1) 数据收集:kaggle下载到分类好的血液细胞数据集。
(2) 数据标注:使用 Labelimg 对淋巴细胞进行标注,获取存放数据的 xml 文件。
(3) PaddleDetection框架搭建:在百度服务器上实现。
(4) 数据集导入,生成对应的类别标签及划分训练集测试集验证集。
(5) 修改配置文件,改参数,配置优化器等。
(6) 开始训练模型并评估。
(7) 用训练出的最佳模型去做预测。