对于检测分类而言可以分为以下四种情况:
True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;
False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;
False negatives(FN): 被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;
True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。
召回率与准确率
Temporal Action Proposal任务不需要对活动分类,只需要找出proposals,所以判断找的temporal proposals全不全就可以测评方法好坏。常用average recall (AR),即平均召回率。
召回率(recall):相当于有几个正确的样本,找到了几个。
准确率(precision):对于做出判断的样本,判断对了几个。
IoU(交并比)/tIoU
此任务的评价指标是与目标检测类似的,这里的proposal就相当于目标检测里的检测框,框的准不准,对框内的分类正确与否,框是不是有冗余等。IoU:目标检测中loU(交并比)是模型所预测的检测框和真实(ground truth)的检测框的交集和并集之间的比例,动作检测改为了对时间(维度是1)的