肺结节分析与模型部署:从理论到实践
1. 额外的灵感与数据来源
1.1 对比学习
在自监督学习领域,对比学习是一种通用的方法。其核心思想是让模型学习到的特征能够有效区分数据集中的不同样本。具体操作是,从当前图像以及大量(设为 K 个)其他图像中提取特征,构成关键特征集。然后设置一个分类前置任务:给定当前图像的特征(查询特征),判断它属于 K + 1 个关键特征中的哪一个。虽然乍一看这个任务很简单,但在训练过程中,即使查询特征与正确类别的关键特征完全匹配,该任务也会促使查询特征与其他 K 个图像的特征尽可能不同(在分类器输出中表现为低概率分配)。
1.2 优化训练数据
1.2.1 多类别标签平滑
之前的恶性分类实际上基于多位放射科医生更细致的分类。我们可以利用之前被简单二分类(“恶性与否”)丢弃的数据,采用五分类的方式。将放射科医生的评估作为平滑标签,对每个评估进行独热编码,然后对给定结节的评估结果求平均值。例如,四位放射科医生对一个结节进行评估,两位认为“不确定”,一位认为“中度可疑”,另一位认为“高度可疑”,那么训练时使用的目标概率分布向量为 [0, 0, 0.5, 0.25, 0.25],计算模型输出与该向量之间的交叉熵。不过,采用这种方法后,我们需要寻找新的模型评估方式,因为传统的二分类准确率、ROC 和 AUC 指标不再适用。
1.2.2 多模型集成
另一种利用多评估结果的方法是训练多个模型,每个模型基于一位放射科医生的标注进行训练。在推理阶段,通过对这些模型的输出概率求平均值等方式进行集成。
1.2.3 多任务学习
我们可以回到 P
超级会员免费看
订阅专栏 解锁全文
48

被折叠的 条评论
为什么被折叠?



