68、GALE机器翻译评估：从TER到HTER及后期编辑流程解析

最新推荐文章于 2025-11-19 07:28:40 发布

nft7creator

最新推荐文章于 2025-11-19 07:28:40 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏：自然语言处理与机器翻译文章标签： GALE 机器翻译评估 TER

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/nft7creator/article/details/155011330

自然语言处理与机器翻译专栏收录该内容

79 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

GALE机器翻译评估：从TER到HTER及后期编辑流程解析

1. 引言

在当前的机器翻译（MT）技术评估中，人工评分工作至关重要。尽管如今人工对MT输出进行后期编辑成本较高，但与上世纪六十年代相比已有很大进步。当时Georgetown大学的MT项目在努力8年后，于1962年尝试产出有用输出时，不得不进行后期编辑，且后期编辑的翻译耗时更长、成本更高。

2. 从TER到HTER

TER的定义 ：TER是衡量将原始MT输出编辑成与人工参考翻译完全匹配时的编辑距离。评分软件仅简单比较原始MT输出和参考翻译。
HTER的提出 ：然而，MT系统输出无需与参考翻译逐字匹配就能传达完整意思。GALE的MT评估指标HTER，衡量的是使MT输出与参考翻译意思一致且同样易于理解所需的最少编辑次数。
HTER的计算 ：在评估多个MT系统处理相同输入的输出时，计算HTER需将每个系统的编辑次数除以参考翻译的单词数，而非原始系统翻译的单词数，以实现分数的直接比较。例如，若系统翻译为 “They traveled to Mexico”，参考翻译为去西班牙，有一处编辑，该例HTER分数为25%（1次错误除以4个标记词）；若系统翻译为 “The group undertook a trip and traveled to the country of Mexico”，同样一处编辑，HTER分数为8%（1次错误除以12个标记词）。

3. 后期编辑指南

指南设计目标

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。