自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2401_85576118的博客

ACL 2024

关注

文章平均质量分 61

关注数：文章数：1 文章阅读量：633 文章收藏量：4

作者: Power2024666

不断的阅读，不断的记录，不断的提升！

展开

NLP论文速读（ACL 2024）|一个指令微调的开放多语言模型（Aya Model: An Instruction Finetuned Open-Access Multilingual ……）

这导致了NLP模型在资源丰富的语言之外的性能差距扩大，模型在模仿训练分布时表现更好，而对于训练中未包含的语言则存在已知的偏见，以及对所有用户的关键安全和安全缺陷。这个指令混合包括了超过50%的资源较少的语言，显著扩展了训练数据的覆盖范围，并且比最近提出的多语言IFT数据集（如xP3）大2.5倍，包含203M个数据点。通过扩展训练数据的覆盖范围和优化数据质量，Aya 模型在多语言任务中取得了显著的性能提升，为多语言模型的发展提供了一个新的方向。

原创 2025-01-17 10:48:11 · 633 阅读 · 0 评论