文章目录
糖尿病视网膜病变(Diabetic Retinopathy,DR)是糖尿病常见且严重的微血管并发症之一,严重威胁糖尿病患者的视力健康。糖尿病视网膜病变可分为非增殖性糖尿病视网膜病变(NPDR)和增殖性糖尿病视网膜病变(PDR),前者又细分为轻、中、重度。
轻度 NPDR 时,眼底主要特征为视网膜微动脉瘤,像红色的小点,同时还会有少量视网膜内出血点,此阶段患者大多无明显症状。发展到中度 NPDR,眼底除了微动脉瘤和出血点增多外,还出现了硬性渗出,呈黄白色、边界清晰的蜡样斑点,部分患者可见棉绒斑,呈灰白色、边界不清的棉絮状,此时患者可能有轻微视力下降。重度 NPDR 的眼底,有较多视网膜内出血,视网膜静脉串珠样改变以及视网膜内微血管异常,视力下降明显。当病情进展为 PDR,眼底会出现新生血管,容易破裂导致玻璃体积血,还有纤维增殖形成纤维血管膜,严重时可致牵拉性视网膜脱离,对视力影响极大。
一、Eyepacs 数据集
- 总样本量:约 35,129 张眼底图像(不同来源提及数量略有差异)。
- 标注体系:采用国际临床糖尿病视网膜病变严重程度量表(ICDRS),分为 0 - 4 级:
- 0 级:无病变
- 1 级:轻度非增殖性 DR(存在微动脉瘤、可能有少量硬性渗出)
- 2 级:中度非增殖性 DR(可见出血点、棉絮斑等病变)
- 3 级:重度非增殖性 DR(出现静脉串珠、视网膜内微血管异常)
- 4 级:增殖性 DR(包含新生血管、玻璃体积血等严重病变)
- 文件相关:数据集包含丰富的眼底图像数据,图像分辨率跨度较大,涵盖从低分辨率到高分辨率的多种图像,为糖尿病视网膜病变的研究提供了多样的图像样本。
二、APTOS2019 数据集
- 总样本量:共 5,590 张眼底图像(其中训练集 3,662 张,测试集 1,928 张)。
- 标注体系:同样采用 ICDRS 0 - 4 级分级标准,与 Eyepacs 数据集标注标准一致,保证了数据标注的规范性和可比性。
- 文件相关:图像为 RGB 格式,分辨率多样,能够反映不同成像条件下的眼底状况,对糖尿病视网膜病变分级诊断的算法研究有重要参考价值。
三、Messdior 数据集
- 总样本量:包含 1,200 张眼底图像,是 2004 年法国国防研究部资助的 TECHNO - VISION 项目中建立的公开眼底图数据库之一。
- 数据源:图像分辨率有 1440×960、2240×1488 和 2304×1536 三种,格式为 TIFF 。
- 标注体系:糖尿病视网膜病变分级标准为 0 - 3 四个级别,并且为每个分级标签为 0 - 2 的图像提供了黄斑水肿的风险信息,与 ICDRS 略有差异:
- 0 级:无病变
- 1 级:轻度非增殖性 DR
- 2 级:中度非增殖性 DR
- 3 级:重度非增殖性 DR 或增殖性 DR
- 文件相关:数据集中的图像来自不同的眼科机构,数据具有一定的多样性,为糖尿病视网膜病变的多方面研究提供了数据支持。
四、Messdior - 2 数据集
- 总样本量:共 1,200 张眼底图像(800 张训练集,400 张测试集),可视为 Messdior 的升级版。
- 标注体系:沿用 0 - 3 级分级标准,但标注过程中通过更严格的流程和更多专家参与,标注一致性显著提升,能更准确地反映糖尿病视网膜病变的状况。
- 文件相关:除了图像数据外,还包含一些元数据,这些元数据能够提供关于图像采集等方面的额外信息,有助于深入研究糖尿病视网膜病变。
五、E_ophtha 数据集
- 总样本量:包含数千张眼底图像(具体数量因不同子集而有所不同)。
- 标注体系:提供详细的病变标注,包括微动脉瘤、出血点、渗出物等,并支持多疾病分类。标注过程由多名资深视网膜专家共同参与,确保了标注的准确性和全面性。
- 文件相关:e_ophtha 由两个子数据库组成,分别是 e - ophtha - ma(微动脉瘤)和 e - ophtha - ex(渗出物)。e - ophtha - ex 包含 47 张有渗出物的图像和 35 张无病变的健康图像;e - ophtha - ma 包含 148 张有微动脉瘤或小出血的图像以及 233 张无病变的图像。这些图像的分辨率有所不同,视野范围为 35° - 50°。图像格式为 JPEG,病变的二进制掩码格式为 PNG,方便研究人员对病变区域进行分析。
数据集对比与应用建议
- 数据对比:这五个数据集在图像数量、分辨率、标注体系等方面存在差异。Eyepacs 数据集样本量较大,涵盖图像丰富;APTOS2019 数据集图像格式为 RGB,适合算法训练;Messdior 数据集图像来自多个眼科机构,数据多样;Messdior - 2 数据集标注一致性高且有元数据支持;E_ophtha 数据集对病变标注详细,有多个子集方便不同疾病分类研究。
- 应用建议:
- 算法开发:对于算法开发,Eyepacs 数据集因样本量大、标注体系完善,可作为首选数据集,用于模型的初步训练,获取丰富的图像特征信息。
- 性能验证:结合 APTOS2019 数据集,该数据集图像在不同成像条件下获取,可用于验证算法在不同质量图像下的性能,提高算法的鲁棒性。
- 病变研究:若进行糖尿病视网膜病变的高精度研究,Messdior 或 Messdior - 2 数据集较为合适,其标注信息有助于开展病变定位与分割等研究,Messdior - 2 数据集的元数据还可为多模态数据融合提供基础,进一步挖掘数据价值。
总结
这五个数据集都为糖尿病视网膜病变的研究提供了重要的数据支持,但在图像来源、数量、分辨率、分级标准以及数据质量等方面存在一定差异,研究人员可根据自身研究目的和需求选择合适的数据集,以推动糖尿病视网膜病变相关研究的发展。
下载
点击下文公众号获取数据集
糖尿病视网膜病变数据集(Eyepacs,APTOS2019,Messdior,Messdior - 2,E_ophtha)