
一、文章主要内容
本文聚焦低资源语言的机器翻译质量评估(QE)任务,针对大型语言模型(LLMs)在该任务中存在的局限性,提出了ALOPE(Adaptive Layer Optimization for Translation Quality Estimation)框架,旨在提升LLMs在无参考翻译场景下的跨语言质量评估性能。
1. 研究背景与问题
- QE任务特点:质量评估需在无参考翻译的情况下,对源语言-目标语言对的翻译质量进行评估,本文重点关注低资源语言的段落级评估,预测0-100分的直接评估(DA)分数,该分数由至少3名人工标注者依据充分性、流畅性和跨语言语义传递性评定。
- 现有LLMs的不足:LLMs预训练目标为因果语言建模,而非回归任务,在需要精细数值预测的QE任务中表现不佳;预训练数据中低资源语言占比少,导致跨语言对齐困难;现有方法多依赖Transformer最后一层表示,忽略了中间层可能存在的有价值信息。
2. 研究方法
- 数据集:采用WMT QE共享任务数据集,涵盖8个低资源语言对(英语到古吉拉特语、印地语、马拉地语、泰米尔语、泰卢固语,以及尼泊尔语、爱沙尼亚语、僧伽罗语到英语),并按特定比例划分为训练集
订阅专栏 解锁全文
875

被折叠的 条评论
为什么被折叠?



