Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages 1. 背景与目的 Pangea 旨在开发一个支持 39 种语言的完全开源多语言、多模态大模型 (MLLM),弥补语言技术领域的资源不均问题,特别是低资源语言的不足。目标是为多语言、多模态研究提供开放的工具和数据集,以促进语言包容性和公平性。 2. 模型架构ÿ