端到端肺结节分析及后续部署指南
在深度学习的肺结节分析领域,我们已经取得了一定的进展。接下来,我们将探讨如何进一步优化模型以及如何将训练好的模型部署到实际应用中。
1. 额外的灵感与数据来源
- 对比学习 :这是一种自监督学习方法,核心在于让模型学习到的特征能够有效区分数据集中的不同样本。具体操作是,提取当前图像和大量(K 个)其他图像的特征,构成关键特征集。然后设置一个分类前置任务,即根据当前图像的特征(查询特征),判断它属于 K + 1 个关键特征中的哪一个。尽管乍一看这个任务很简单,但训练过程会促使查询特征与其他 K 个图像的特征尽可能不同。可参考动量对比学习的相关内容。
- 优化训练数据
- 使用五类数据 :恶性分类实际上基于多位放射科医生更细致的分类。我们可以利用之前被简单二分(恶性或非恶性)而丢弃的数据,采用五类分类法。将放射科医生的评估作为平滑标签,对每个评估进行独热编码,然后对给定结节的评估结果求平均值。例如,四位放射科医生对一个结节进行评估,两位认为是“不确定”,一位认为是“中度可疑”,另一位认为是“高度可疑”,那么训练时使用的目标概率分布向量就是 [0, 0, 0.5, 0.25, 0.25]。不过,这样做需要找到新的评估模型的方法,因为我们失去了二元分类中简单的准确率、ROC 和 AUC 概念。
- 多模型训练 :可以训练多个模型,每个模型基于一位放射科医生的标注进行训练。在推理时,通过对这些模型的输出概率求平均值等方式进行集成。
超级会员免费看
订阅专栏 解锁全文
1208

被折叠的 条评论
为什么被折叠?



