LITRANSPROQA: An LLM-based LITerary TRANSlation Evaluation Metric with PROfessional Question

在这里插入图片描述

文章主要内容总结

本文聚焦于文学翻译评估领域,针对现有评估指标过度关注机械准确性、忽视艺术性表达及文化真实性的问题,提出了一种基于大语言模型(LLM)的新型评估框架 LITRANSPROQA。该框架通过整合专业文学译者和研究者的见解,设计了一套针对文学翻译核心要素(如文学手法、文化理解、语气等)的问答体系,无需参考译文即可评估翻译质量。

关键实验与结果
  • 数据集:使用LITEVAL-CORPUS、LITERARYTRAN、PAR3-ANNOTATED等多语言文学翻译数据集,涵盖德-英、英-中、法-英等语言对,包含专业人工翻译和机器翻译结果。
  • 对比方法
    • 微调XCOMET-XL:在文学任务上进行微调,但性能提升有限,且存在计算成本高、稳定性不足的问题。
    • 现有SOTA指标:如GEMBA-MQM、XCOMET-XL等,在文学翻译评估中普遍低估人工翻译质量,与人类判断的相关性较低。
  • LITRANSPROQA性能
    • 相关性与充分性:在ACC-EQ和Kendall
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值