Mistral AI推出了Mismtral Saba,这是一种240亿个参数模型,旨在改善阿拉伯语和几种印度 - 原始语言,尤其是泰米尔语之类的南印度语言。与可能缺乏必要的区域环境的通用模型不同,Mistral Saba在中东和南亚的策划数据集上进行了培训,以提供更语言和文化上准确的响应。
早期采用者正在测试以下领域的Mistral SABA。
- 会话AI:支持阿拉伯语的虚拟助手和客户服务。
- 特定于行业的AI:用于金融,医疗保健和能源等领域的微调。
- 内容产生:生产与区域相关的教育和业务材料。
基准比较突出了Mistral Saba在阿拉伯语任务中的出色表现。该模型的表现优于较大的模型,例如Llama 3.1(70b)和Jais(70b),包括MMLU,Tydiqagoldp,Alghafa和Hellaswag在内的多个阿拉伯基准。值得注意的是,正如皇冠标志物所示,它在阿拉伯alghafa和英语MMLU中达到了最高的精度。
资料来源:Mistral AI博客
该版本在AI社区引起了人们的关注。 Hedi首席执行官Roxana Rotaru指出:
这是一个很好的消息,标志着AI民主化的转折点。到目前为止,大多数语言模型主要接受了英语培训,为数百万用户创造了语言和文化障碍。
同样,微软产品管理和工程负责人Sivaprasad Macha指出了提高AI处理区域语言能力的重要性:
在捕捉区域语言和文化差异的细微差别和复杂性时,许多大型语言模型缺乏。南印度语言是文化遗产的宝库。很高兴看到Mistral的这一公告。
尽管该模型受到了良好的接收,但有些人提出了有关透明度的问题。名为Arsneph的用户问:
这是一个新模型,还是他们只是继续预先培训Mistral Small?当许多中东国家还有其他选择时,为什么这种不开放的体重? Mistral所说的其他发行版将要到哪里?
这些担忧反映了关于AI开放性和可访问性的更广泛讨论,尤其是在寻求更多本地语言AI解决方案的地区。
该模型可通过API获得,可以在本地部署,从而使组织可以在其基础架构中运行。