EthioLLM: Multilingual Large Language Models for Ethiopian Languages with Task Evaluation

EthioLLM是首个针对埃塞俄比亚五种语言和英语的多语言大型语言模型,研究了其在NLP任务中的性能。文章介绍新基准数据集EthioBenchmark,并开源了模型和数据,显示了在多种任务上的竞争力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《EthioLLM: Multilingual Large Language Models for Ethiopian Languages with Task Evaluation》的翻译。

EthioLLM:具有任务评估的埃塞俄比亚语言多语言大语言模型

摘要

大型语言模型(LLM)由于其在各种下游自然语言处理(NLP)任务中的出色性能,近年来越来越受欢迎。然而,由于训练LLM的资源不足,低资源语言仍然落后于NLP领域当前最先进的(SOTA)发展。埃塞俄比亚语言表现出显著的语言多样性,包括各种各样的文字,并具有深刻的宗教和文化意义。本文介绍了埃塞俄比亚LLM——五种埃塞俄比亚语言(阿姆哈拉语、盖兹语、阿凡奥罗莫语、索马里语和提格里尼亚语)和英语的多语言大型语言模型,以及埃塞俄比亚语标记——各种下游NLP任务的新基准数据集。我们评估了这些模型在五个下游NLP任务中的性能。我们开源了我们的多语言语言模型、各种下游任务的新基准数据集以及特定任务的微调语言模型,并讨论了模型的性能。我们的数据集和模型可在EthioNLP HuggingFace存储库中获得。

1 引言

2 相关工作

3 EthioLLM

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值