由于之前哔站作者整理的
LUNA16
数据处理方式过于的繁琐,且训练阶段耗时明显,降低了GPU显存的利用率。
于是,本文就对LUNA16
数据做一个新的整理,最终得到的数据和形式是差不多的。但是,主要不同的是代码逻辑比较的简单,便于理解。
对于LUNA16
数据集的学习,可以去参考这里:【3D 图像分类】基于 Pytorch 的 3D 立体图像分类3(LIDC-IDRI 肺结节 XML 特征标签 PKL 转储)
本文的主要步骤和中心内容,包括一下几个部分:
masks
生成:从xml
文件中,抽取出对应序列series
的结节标记位置坐标(可能一个结节多人多次标注),生成对应的mask
数组文件,大小与图像数组大小一致;- 肺实质提取操作:从肺区分割的数据中,与原始图像和
mask
图做乘积操作,非肺区部分进行填充,或者去除操作均可;