模型训练指标优化与数据集平衡策略
1. 精度与召回率
1.1 精度的概念
精度(Precision)可以理解为“不确定就不叫”。以一只名为Preston的狗为例,它只有确定是窃贼时才会吠叫。从形式上来说,精度是真正例(True Positives)与真正例和假正例(False Positives)并集的比值。Preston通过将分类阈值推到最右边,尽可能排除无趣的负事件,从而实现了极高的精度,几乎达到1.0,即它吠叫的对象中99%都是盗贼。
1.2 在训练中实现精度和召回率
精度和召回率在训练过程中是非常有价值的指标,它们能让我们深入了解模型的表现。如果其中任何一个指标降为零,很可能意味着模型开始出现退化行为。我们可以通过更新 logMetrics 函数,将精度和召回率添加到每个训练周期的输出中,以补充我们已有的损失和准确率指标。
下面是计算所需值的代码:
neg_count = int(negLabel_mask.sum())
pos_count = int(posLabel_mask.sum())
trueNeg_count = neg_correct = int((negLabel_mask & negPred_mask).sum())
truePos_count = pos_correct = int((posLabel_mask & posPred_mask).sum())
falsePos_count = neg_count - neg_correct
falseNeg_count = pos_
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



