MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

828 篇文章

已下架不支持订阅

本文深入研究了多模态大型语言模型(MLLMs)的构建,通过全面的消融实验揭示了架构组件和数据选择的重要性。MM1,一个包含30B参数的模型家族,通过大规模预训练在多项基准测试中表现出色,展现出强大的上下文学习和多图像推理能力。

本文是LLM系列文章,针对《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的翻译。

摘要

在这项工作中,我们讨论了建立高性能的多模态大型语言模型(MLLMs)。特别是,我们研究了各种体系结构组件和数据选择的重要性。通过对图像编码器、视觉语言连接器和各种预训练数据选择的仔细而全面的消融,我们确定了几个关键的设计教训。例如,我们证明,与其他已发表的预训练结果相比,对于使用图像字幕、交错图像文本和纯文本数据的仔细混合的大规模多模态预训练,在多个基准上实现最先进的(SOTA)小样本结果是至关重要的。此外,我们还表明,图像编码器以及图像分辨率和图像token计数具有实质性影响,而视觉语言连接器设计的重要性相对可以忽略不计。通过放大所提出的配方,我们构建了MM1,这是一个高达30B参数的多模态模型家族,由密集模型和专家混合(MoE)变体组成,在预训练指标中是SOTA,并在对一系列已建立的多模态基准进行监督微调后实现竞争性能。得益于大规模的预训练,MM1具有增强的上下文学习和多图像推理等吸引人的特性,能够实现少样本的思维链提示。

1 引言

2 相关工作

3 构造MM1的配方

4 最终的模型和训练的配方

5 监督微调

6 结论

我们研究如何构建高性

已下架不支持订阅

在SPI(Simulation Program with Integrated Circuit Emphasis,集成电路仿真程序)文件和SPICE(Simulation Program with Integrated Circuit Emphasis)仿真环境中: #### XMM1 XMM1 通常是一个电路元件的实例名称。在 SPICE 里,以“X”开头的标识符一般代表子电路的实例。所以 XMM1 可能是一个特定子电路的实例化名称,这个子电路可能包含了多个晶体管、电阻、电容等元件,用于实现特定的电路功能,例如一个放大器或者一个逻辑门电路等。 #### MM1:DRN MM1 可能是一个 MOSFET(金属 - 氧化物 - 半导体场效应晶体管)的实例名称。“DRN”代表漏极(Drain)。在 MOSFET 中,漏极是电流流出的电极。所以 MM1:DRN 指的是名为 MM1 的 MOSFET 元件的漏极端口,在电路仿真时,该端口会有相应的电压和电流值,可用于分析电路的工作状态。 #### MM1:GATE 同样,MM1 是 MOSFET 实例名,“GATE”代表栅极(Gate)。栅极是 MOSFET 的控制电极,通过在栅极上施加不同的电压,可以控制 MOSFET 沟道的导通和截止,从而实现对电路中电流的控制。MM1:GATE 就是名为 MM1 的 MOSFET 的栅极端口。 #### MM1:SRC “SRC”代表源极(Source)。源极是 MOSFET 中电流流入的电极。MM1:SRC 就是名为 MM1 的 MOSFET 的源极端口,它和漏极、栅极一起构成了 MOSFET 的基本工作结构。 #### MM1:BULK “BULK”代表衬底(Bulk)。在 MOSFET 中,衬底是构成器件的半导体材料基体。MM1:BULK 指的是名为 MM1 的 MOSFET 的衬底端口。衬底的电位对 MOSFET 的阈值电压等参数有影响,在某些电路设计中,需要对衬底电位进行特殊处理。 #### MXMM1.main_0x4 MXMM1 可能也是一个子电路或者特定元件的实例名称。“main_0x4” 可能是该实例内部的一个节点名称。在复杂的电路中,为了便于对不同的节点进行区分和分析,会给各个节点赋予特定的名称。“0x4” 可能是一个十六进制的编号,用于标识该节点在电路中的特定位置或者功能。例如,在一个包含多个子模块的电路中,main_0x4 可能代表某个子模块中的一个关键节点,该节点的电压或者电流值对于整个电路的性能有重要影响。 ### 代码示例 以下是一个简单的 SPICE 代码示例,展示了一个 MOSFET 元件的定义和连接: ```spice * 定义一个 MOSFET 实例 MM1 DRN GATE SRC BULK NMOS VDD DRN 0 DC 5V VG GATE 0 DC 3V * 仿真命令 .DC VG 0 5 0.1 .PROBE .END ``` 在这个示例中,MM1 就是一个 NMOS 晶体管的实例,它连接了漏极(DRN)、栅极(GATE)、源极(SRC)和衬底(BULK)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值