Peacock: A Family of Arabic Multimodal Large Language Models and Benchmarks

本文介绍了Peacock,一个阿拉伯语的多模态大型语言模型家族,旨在提升阿拉伯语和方言的多模态理解。Peacock在视觉推理任务上表现出色,并通过Henna基准测试评估阿拉伯文化相关的MLLM能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是LLM系列文章,针对《Peacock: A Family of Arabic Multimodal Large Language Models
and Benchmarks》的翻译。

Peacock:阿拉伯语多模态大语言模型和基准家族

摘要

多模态大语言模型(MLLMs)已被证明在需要复杂推理和语言理解的广泛任务中是有效的。然而,由于缺乏英语以外语言的高质量多模态资源,MLLM的成功仍然相对局限于以英语为基础的环境。这对开发其他语言的可比模型提出了重大挑战,甚至包括阿拉伯语等母语人口众多的语言。为了缓解这一挑战,我们引入了一个全面的阿拉伯语MLLMs家族,名为Peacock,具有强大的视觉和语言能力。通过全面的定性和定量分析,我们展示了我们的模型在各种视觉推理任务上的扎实表现,并进一步展示了它们新兴的方言潜力。此外,我们还介绍了Henna,这是一个专门为评估阿拉伯文化相关方面的MLLMs而设计的新基准,为具有文化意识的阿拉伯MLLMs奠定了第一块基石。Peacock项目的GitHub存储库位于https://github.com/UBC-NLP/peacock

1 引言

2 相关工作

3 Peacock

4 数据集和基准

5 实验

6 结论

在这篇工作中,我

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值