Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning

本文是LLM系列文章,针对《Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient Adaptation》的翻译。

通过量化感知尺度学习推进多模态大型语言模型以实现高效适应

摘要

本文提出了第一项研究,探讨了多模态大型语言模型参数量化的潜力,以减轻视觉语言指令调整过程中遇到的重大资源限制。我们介绍了一种基于多模态预热的量化感知 Scale LeArning 方法,称为 QSLAW。该方法基于两项关键创新:(1) 学习量化 LLM 权重的分组比例因子,以减轻由激活异常值引起的量化误差并实现更有效的视觉语言指令调整;(2) 实现多模态热身,逐步整合语言和多模态训练样本,从而防止量化模型与多模态数据的过度拟合,同时确保多模态大型语言模型稳定适应下游视觉语言任务。大量实验表明,QSLAW 量化的模型性能与全精度模型相当,甚至超过全精度模型,同时将 VL 调整时间和 GPU 消耗减少多达 1.4 倍。我们的代码在 https://github.com/xjjxmu/QSLAW 发布。

1 引言

2 相关工作

3 方法

4 实验

5 结论

在本文中,我们首次研究了 MLLM 参数量化在减少 VL 指令调整期间的训练开销的潜力。我们提出了一种基于多模态预热 (QSLAW) 的量化感知量表学习方法。QSLAW 采用量化和最少的可训练缩放因子来实现高效的 VL 指令调优。引入了一种新的模态感知热身,以确保规模学习在保留其原始语言知识的同时获得足够的多模态指令监督。我们验证了 QSLAW 在各种设置下的有效性,展示

给定引用资料里未提及MDSF - YOLO(基于多尺度膨胀序列融合网络推进目标检测的方法)的相关信息,所以无法依据引用内容提供其在目标检测中的应用及相关信息。不过,一般而言,多尺度膨胀序列融合网络在目标检测中的应用可能体现在以下方面: 在目标检测任务里,不同大小的目标往往需要不同尺度的特征来准确检测。多尺度膨胀序列融合网络能够利用多尺度特征,通过膨胀卷积增大感受野且不损失分辨率,从而有效捕捉不同大小目标的特征。膨胀卷积可以在不增加参数数量的情况下,扩大卷积核的感受野,这对于检测大目标非常有用;同时,多尺度特征融合有助于检测小目标,因为小目标可能只在浅层特征图中体现明显特征。 以下是一个简单的伪代码示例,用于说明多尺度膨胀序列融合网络的基本概念: ```python import torch import torch.nn as nn class MDSFBlock(nn.Module): def __init__(self, in_channels, out_channels): super(MDSFBlock, self).__init__() # 不同膨胀率的卷积层 self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, dilation=1, padding=1) self.conv2 = nn.Conv2d(in_channels, out_channels, kernel_size=3, dilation=2, padding=2) self.conv3 = nn.Conv2d(in_channels, out_channels, kernel_size=3, dilation=3, padding=3) def forward(self, x): # 分别进行不同膨胀率的卷积 out1 = self.conv1(x) out2 = self.conv2(x) out3 = self.conv3(x) # 特征融合 out = torch.cat([out1, out2, out3], dim=1) return out # 示例使用 input_tensor = torch.randn(1, 3, 224, 224) mdsf_block = MDSFBlock(3, 16) output = mdsf_block(input_tensor) print(output.shape) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值