35、模型训练指标优化与数据集平衡策略

cake8

于 2025-08-19 10:19:54 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch实战：从入门到医疗AI 文章标签：精度召回率 F1分数

本文链接：https://blog.youkuaiyun.com/cake8/article/details/151164464

PyTorch实战：从入门到医疗AI 专栏收录该内容

51 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

模型训练指标优化与数据集平衡策略

1. 精度与召回率

1.1 精度的概念

精度（Precision）可以理解为“不确定就不叫”。以一只名为Preston的狗为例，它只有确定是窃贼时才会吠叫。从形式上来说，精度是真正例（True Positives）与真正例和假正例（False Positives）并集的比值。Preston通过将分类阈值推到最右边，尽可能排除无趣的负事件，从而实现了极高的精度，几乎达到1.0，即它吠叫的对象中99%都是盗贼。

1.2 在训练中实现精度和召回率

精度和召回率在训练过程中是非常有价值的指标，它们能让我们深入了解模型的表现。如果其中任何一个指标降为零，很可能意味着模型开始出现退化行为。我们可以通过更新 logMetrics 函数，将精度和召回率添加到每个训练周期的输出中，以补充我们已有的损失和准确率指标。

下面是计算所需值的代码：

neg_count = int(negLabel_mask.sum())
pos_count = int(posLabel_mask.sum())
trueNeg_count = neg_correct = int((negLabel_mask & negPred_mask).sum())
truePos_count = pos_correct = int((posLabel_mask & posPred_mask).sum())
falsePos_count = neg_count - neg_correct
falseNeg_count = pos_