BLEU机器翻译评价指标学习笔记

最新推荐文章于 2025-06-13 17:10:29 发布

kuaizi_sophia

最新推荐文章于 2025-06-13 17:10:29 发布

阅读量2.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：评价指标文章标签：评价指标机器翻译 Image Caption 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/kuaizi_sophia/article/details/83900507

BLEU是一种用于评估机器翻译质量的指标，通过比较机器译文与参考译文的n-gram精度。它考虑了翻译的充分性和流畅性，并通过惩罚因子调整不同长度的翻译。虽然BLEU方便快速，但忽略了语法准确性和同义词表达。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

BLEU机器翻译评价指标学习笔记

BLEU(bilingual evaluation understudy)，双语互译质量评估辅助工具，主要用来评估机器翻译质量的工具。

评判思想：机器翻译结果越接近专业人工翻译的结果，则越好。

实际工作：判断两个句子的相似程度。

计算公式：
$\cdot exp\Big(\sum_{n=1}^{N}{w_nlog{p_n}}\Big)$
其中，BP为惩罚因子， $p_n$ 为多元精度， $w_n$ 为多元精度对应的权重。

多元精度n-gram precision

原始多元精度

原文：猫坐在垫子上
机器译文： the the the the the the the.
参考译文：The cat is on the mat.

1元精度 1-gram

6个词中，5个词命中译文，1元精度 $p_1$ 为5/6.
2元精度 2-gram

2元词组的精度则是 3/5.
3元精度 3-gram

3元词组的精度为1/4.
4元精度 4-gram

4元词组的精度为0。

一般情况，1-gram可以代表原文有多少词被单独翻译出来，可以反映译文的充分性，2-gram以上可以反映译文的流畅性，它的值越高说明可读性越好。

异常情况

原文：猫坐在垫子上
机器译文： the the the the the the the.
参考译文：The cat is on the mat.

此时，1-gram匹配度为7/7，显然，此译文翻译并不充分，此问题为常用词干扰。

改进多元精度

$Count^{clp}_{w_i,j}=min{(Count_{w_i},Ref_jCount_{w_i})}\\ Count^{clp}=max(Count^{clp}_{w_i,j}),i=1,2,3\cdots\\ p_n=\frac{\sum_{C\in{Candidates}}{\sum_{n-gram\in C}{Count_{clip}(n-gram)}}}{\sum_{C^{'}\in{Candidates}}{\sum_{n-gram^{'}\in C^{'}}{Count_{clip}(n-gram^{'})}}}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。