详解BLEU的原理和计算

机器翻译指标或者image caption指标BLEU的原理和计算

参考:

《BLEU: a Method for Automatic Evaluation of Machine Translation》

计算方法(The Baseline BLEU Metric):
1、precision measure

为了计算精度,只需计算任何参考翻译中出现的候选翻译词(unigrams)的数量,然后除以候选翻译中的总词数。

2、Modified n-gram precision

先对原理总介绍,然后2.1-2.3分别介绍Modified n-gram precision在三种场景下的应用。

首先计算一个单词在任何单个参考翻译中出现的最大次数。 接下来,将每个候选词的总计数除以其最大参考计数,将这些截断的计数相加,然后除以候选词的总数(未截断)。

注:n-gram指的是将n个词作为一个整体,1-gram指的是一个词,2-gram指的是两个连起来的词。对应的matrix就是BLEU-n。BLEU-1更注重单个词的出现,BLEU-4更注重句子的流畅性。

总结:首先提出一种基本的计算方法,然后对其进行优化。优化的思路很重要(举极限的反例来证明):使用1的方法有一个问题,会导致机器翻译系统可能会过度生成“合理”的单词,导致翻译结果很差但精度很高,例如下面的示例2.1:如果使用1的方法计算:BLEU-1 = 7/7。使用2的方法计算:BLEU-1 = 2/7。显然candidate是很差的,使用2的计算结果更合理。

'''
示例2.1
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

KPer_Yang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值