使用分割方法寻找疑似结节
1. 数据标注与LIDC说明
新的标注除了 hasAnnotation_bool 和 isMal_bool 标志(本章暂不使用)外,其使用方式与旧标注相同。有人可能会疑惑为何之前未讨论LIDC,实际上LIDC围绕其底层数据集构建了大量工具,甚至可以从PyLIDC获取现成的掩码。但这种情况不能代表一般数据集的支持情况,因为LIDC的支持异常完善。而对LUNA数据的处理方式更具代表性,能让人更好地学习,因为我们专注于处理原始数据,而非学习他人编写的API。
2. 实现Luna2dSegmentationDataset
2.1 训练和验证集划分
本次采用不同的训练和验证集划分方法,使用两个类:一个作为适用于验证数据的通用基类,另一个作为训练集的子类,具备随机化和裁剪样本的功能。这种方式虽在某些方面更复杂,但简化了随机训练样本的选择逻辑,能清晰区分影响训练和验证的代码路径。
2.2 数据形式
生成的数据是具有多个通道的二维CT切片,额外通道存储相邻的CT切片。对于分类模型,将切片视为3D数据数组并使用3D卷积处理;对于分割模型,将每个切片视为单个通道,生成多通道2D图像,就像处理RGB图像的颜色通道一样。
2.3 验证数据处理
验证时,为每个有正掩码条目的CT切片生成一个样本。由于不同CT扫描的切片数量不同,引入新函数将每个CT扫描及其正掩码的大小缓存到磁盘,以快速构建验证集的完整大小。该函数如下:
@raw
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



