机器翻译自动评测方法BLEU值方法

BLEU是IBM Watson研究中心2002年提出的机器翻译自动评测方法,通过比较候选译文与参考译文的n元组匹配度来评估翻译质量。该方法与人工评价相关,具有高效、低成本、语言无关的特点。实验通过多组翻译结果对比,证明BLEU值能准确反映翻译质量,展示了其在评测中的稳定性和可靠性。

    最近看了看目前用得最广的机器翻译自动评测方法BLEU的原始论文,觉得这篇paper里面的工作做得很nice。让我很有感触。

    随着统计机器翻译方法的兴起,一个有趣的问题摆在人们的面前:如何评价一个机器翻译方法的好坏?

    最开始人们选用的是人工评测的方法,那就是一个翻译结果得到后,找一批专家来给每个句子翻译结果打分,然后统计均分。这里面就有问题了?首先,如果两个翻译结果给两批专家打分,如何保证我们打分的尺度一致。退一步讲就是一批专家给两个翻译结果打分,也无法保证打分尺度一致。人,毕竟不是机器嘛。其次,人工测评太耗费人力物力,并且无法再利用。现在机器翻译结果,让你等个十天八天再看结果,你修改一下你的系统,跑个新结果,又得等个十天八天的让专家打分,谁受得了?在这样的背景下,搞机器翻译的学者们迫切的希望有一种能够自动的客观的评价方法来代替人工评价。

    自动评测方法有很多种,我就不一一列举了。这里讲的是IBM的watson研究中心在02年提出的BLEU方法。paper的摘要就简明说明BLEU方法是高效低代价,与语言无关,并且——也是最重要的——与人工评价非常的相关(没有说接近,文章使用的是correlate,用词很考究)。

       

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值