前沿科技速递🚀
9月26日Meta 推出了 Llama 3.2,这是一个前沿的多模态大语言模型系列。该系列包括轻量级文本模型(1B 和 3B)以及视觉模型(11B 和 90B),专为在边缘和移动设备上的高效应用而设计。这些模型经过预训练和指令调优,特别适合于实时处理和个性化需求,能够在多种任务中展现出卓越的表现,包括文本生成、图像理解和数据摘要。
来源:传神社区
01 模型简介
Meta 于2024年推出了 Llama 3.2,这是一个创新的多模态大语言模型系列。该系列包含轻量级文本模型(1B 和 3B)和视觉模型(11B 和 90B),旨在支持在边缘和移动设备上的高效应用。这些模型经过预训练和指令调优,特别适合于实时处理和个性化应用,能够在多种任务中提供卓越表现,包括文本生成、图像理解和数据摘要。

02 技术亮点
1. 多模态支持
Llama 3.2 引入了图像推理功能,11B 和 90B 模型能够处理文本与图像的组合输入。通过整合视觉和语言模型,这些模型可用于生成图像说明、回答与图像相关的问题,并进行复杂的视觉推理。

最低0.47元/天 解锁文章
1067

被折叠的 条评论
为什么被折叠?



