放射组学:原理、工具与未来展望
数据划分与评估集的使用
在放射组学研究中,数据划分是一个关键步骤。可以采用分层的方式进行数据划分,这样不同类别样本在不同折或训练集、验证集和评估集中的分布相同。分层方法的优势在于避免结果出现偏差,因为若不采用分层,方法的训练或评估可能会偏向某一特定类别。
除了从单一数据集中生成训练集、验证集和评估集外,还可以使用单独的数据集作为评估集,同时使用交叉验证来生成训练集和验证集。这种方法适用于数据集之间有明显区别的情况,例如使用开源数据集或从不同机构获取的数据。使用单独评估集时,要确保其具有代表性,并且只能在整个放射组学流程构建和训练完成后使用,不能将其用作验证集。这样做的好处是可以评估模型在新环境中的典型性能。
评估指标的选择
选择合适的评估指标对于准确衡量放射组学流程的性能至关重要。常见的评估指标是准确率,但在评估数据存在类别不平衡时,准确率往往会给出有偏差的性能评估。例如,在一个数据集中有90个类别1的样本和10个类别2的样本,若算法将所有样本都预测为类别1,准确率可达90%,但实际性能并无价值。
为解决这个问题,可以使用灵敏度和特异性等指标,它们能报告单个类别的准确率。若要评估整个流程在所有类别上的总体性能,可以使用接收者操作特征曲线下面积(AUC)和F1分数。
ROC曲线展示了不同分类器阈值下的真阳性率(TPR,即灵敏度)与假阳性率(FPR,即1 - 特异性)的关系。AUC是ROC曲线下的面积,取值范围在0到1之间,0.5表示随机猜测。报告AUC时,同时展示对应的ROC曲线很有帮助,因为两条曲线的AUC可能相同,但形状可能差异很大。F1分数是精确率和召回率(灵敏度)的调和平均值,平
超级会员免费看
订阅专栏 解锁全文
2848

被折叠的 条评论
为什么被折叠?



