作者:李素琴、吴练练、宫德馨、胡珊、陈奕云、朱晓云、李夏、于红刚
效果视频链接:https://www.xhnj.com/m/video/1008384.htm
小结
从算法的角度来说,作为2020发布的论文,使用的技术是比较落后的了。一个息肉检测项目,它使用了YOLO算法(应该是v1)来得到候选集,阈值使用 0.2 0.2 0.2,然后使用ResNet进行类别识别。
ResNet使用的是ResNet152,文中有说YOLO+ResNet152的系统达到了25帧/s 的处理速度,暂不知道处理平台。大概率是1080Ti,同期的腾讯觅影使用的YOLOv3,也是1080Ti上达到“实时”。
从视频效果来看,算法系统的检测速度是不够的,明显有时延,应该是异步检测,检测速度不足且未同步的结果。从准确性看,小目标,以及不在正面的目标,效果检测效果一般。
作为一个做着息肉识别的开发者来说,添加一个病灶检测分类,也是可以理解的,因为一些气泡/组织确实较难处理。况且是五年前的算法结构(实际上是 10 10 10年了,YOLO和ResNet均是十年前提出的),昨日的bad case今日或许easy。
但本文的数据集,已经剔除掉大量的气泡/粪水等实际的难点,是经过筛选过的数据。且从视频的效果来看,一些观察角度不正、较小的息肉,应该也不在测试集数据上。验证集应该相对简单。
从摘要的指标来看,即使筛选过的测试集,其假阳性其实也不低,虽然文中说比其他文献要高了。
摘要
算法系统由YOLO和ResNet152构建,系统在本文称作DCNN。
数据集有4个来源,其中数据集 1 1 1作为训练集,数据集 2 / 3 / 4 2/3/4 2/3/4均为测试集。
数据 1 / 3 / 4 1/3/4 1/3/4的来源都是从武汉大学人民医院消化内镜中心数据库2018年01月 - 2019年03月的肠镜图像及视频。
- 数据集 1 1 1(2018年01月-2018年11月),共 4700 4700 4700张。其中 3700 3700 3700张带息肉,训练YOLO; 1000 1000 1000张不带息肉,结合前面的 1000 1000 1000张带息肉,共 2000 2000 2000张来训练ResNet;
- 数据集 2 2 2(CVC-ClinicDB),开源数据集,共 612 612 612张,来源 29 29 29个结肠镜检查视频。所有图像均有息肉,用于测试和与其他文献对比;
- 数据集 3 3 3(2019年01月-2019年03月),共 720 720 720张图像,含息肉图像 320 320 320张,不含息肉图像 400 400 400张;
- 数据集