目录
前言
在AI与深度学习逐渐发展成熟的趋势下,人工智能和大数据等技术开始进入了医疗领域,它们把现有的一些传统流程进行优化,大幅度提高各种流程的效率、精度、用户体验,同时也缓解了医疗资源的压力和精确度不够的问题。
智能医疗有很多的发展方向,例如医学影像处理、诊断预测、疾病控制、健康管理、康复机器人、语音识别病历电子化等。当前人工智能技术新的发力点中的医学图像在疾病的预测和自动化诊断方面有非常大的意义,本篇即针对医学影像中的胸部X射线部分进行研究,利用公开数据集+开源算法YOLOv8来训练模型,模拟医疗胸X射线方向实用场景。
数据集
为了向研究界提供具有高质量标签的大型胸部x射线(CXR)图像数据集,vindr从108医院和河内医科大学医院(越南最大的两家医院)收集的100,000多张DICOM格式的原始图像中构建了VinDr-CXR数据集。公布的数据集由18,000个前后(PA)CXR扫描组成,这些扫描带有关键发现的定位和常见胸部疾病的分类。这些图像由一组至少有8年经验的17名放射科医生对22个关键发现(局部标签)和6个诊断(全局标签)进行注释;每个发现都用边界框来定位。局部和全局标签分别对应于标准放射学报告的“发现”和“印象”部分。
vindr将数据集分为两部分:15000次扫描的训练集和3000次扫描的测试集。训练集中的每幅图像都由3名放射科医生独立标记,而测试集中的每幅图像的注释经过更仔细的处理,并从5名放射科医生的共识中获得。标记过程是通过我们自己的基于网络的框架VinDr Lab执行的,该框架建立在图像存档和通信系统(PACS)之上。
此数据集为vindr公开数据集,原版是DICOM格式,我自己处理了一下,转成了YOLO格式,已上传至百度网盘(24.2G大小)请先下载: