评价指标F1之Mirco-F1和Macro-F1

在做对话任务时有个自动评价指标F1,用来评测预测句子相较于ground truth中实体的重复率,但是在计算时,F1的计算方法有两种,一种是计算单个的F1值,最后计算平均,称为Marco-F1;另外一种是首先计算整体准确率和召回率,最后在计算F1值,称之为Mirco-F1。

  • F1的计算公式:
    F1=2*(P*R)/(P+R)
    P是Precision,准确率
    R是Recall,召回率

  • 准确率和召回率的计算公式:
    Precision=TP/(TP+FP)
    Recall=TP/(TP+FN)

    真阳性(TP):预测为正P(Positive),实际为正(Truth,预测正确)
    假阳性(FP):预测为正P(Positive),实际为负(False,预测错误)
    假阴性(FN):预测为负N(Negative),实际为正(False,预测错误)
    真阴性(TN):预测为负N(Negative),实际为负(True,预测正确)

    准确率衡量预测为正中有多少是对的
    召回率表示正例中预测出多少

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值