商汤开源大模型压缩工具LLMC!单卡压缩Llama 3.1 405B

部署运行你感兴趣的模型镜像

关注公众号:青稞AI,第一时间学习最新AI技术
🔥青稞Talk主页:qingkelab.github.io/talks

大语言模型(LLM)的最新进展以其卓越的涌现能力和推理能力推动我们走向通用人工智能。然而,大量的计算和内存要求限制了广泛采用。量化是一种关键的压缩技术,可以通过压缩和加速 LLM 来有效缓解这些需求,尽管存在潜在的准确性风险。许多研究的目的是尽量减少与量化相关的精度损失。然而,它们的量化配置各不相同,无法公平比较。
在这里插入图片描述

来自北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,一个即插即用的压缩工具包,以公平、系统地探索量化的影响。 LLMC 集成了数十种算法、模型和硬件,提供了从整数到浮点量化、从 LLM 到视觉语言(VLM)模型、从固定位到混合精度、从量化到稀疏化的高度可扩展性。

在这个多功能工具包的支持下,LLMC 基准测试涵盖了三个关键方面:校准数据、算法(三种策略)和数据格式,为用户的进一步研究和实践指导提供了新颖的见解和详细的分析。在使用 LLMC 对Llama 3.1进行量化压缩后,可以使得一张80G A100即可完成 Llama 3.1 405B 的校准和评估,从而实现以超低成本进行量化。

LLMC已开源,欢迎大家Star!

https://github.com/ModelTC/llmc

10月11日晚7点,青稞Talk 第25期,商汤科技算法实习生、香港科技大学准博士生黄雨石,将直播分享《LLMC:大语言模型的量化基准》。

Talk 信息

主讲嘉宾

黄雨石,本科毕业于北京航空航天大学,即将进入香港科技大学攻读计算机博士学位。研究方向为高效的AIGC模型,神经网络压缩与加速等,目前已在CVPR, EMNLP, ACM MM发表多篇论文。

主题提纲

LLMC:大语言模型的量化基准

1、大语言模型量化技术概述
2、大模型压缩工具 LLMC
3、基于 LLMC 的量化基准测试

  • 校准数据
  • 算法(三种策略)
  • 数据格式

直播时间

10月11日(周五)19:00 - 20:00

参与方式

Talk 将在青稞·知识社区上进行,可以添加【ai_qingke113】对暗号:" 1011 ",报名进群!

您可能感兴趣的与本文相关的镜像

Qwen3-VL-8B

Qwen3-VL-8B

图文对话
Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型,这一代在各个方面都进行了全面升级:更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力,以及更强的代理交互能力

商汤科技在大规模人工智能模型领域取得了显著进展,其核心成果之一是“日日新”大模型体系。该模型体系基于商汤历时五年打造的AI大装置,这一装置不仅是国内稀缺的大模型建设基础设施,也是商汤在AGI(通用人工智能)时代的重要技术底座。通过大装置,商汤构建了从模型开发、训练到部署的全流程平台,不仅支持内部模型体系的持续演进,还能对外提供大模型训练赋能服务,已成功应用于多个行业和企业,服务8家大型客户[^1]。 “日日新”大模型体系涵盖了多种类型的AI模型,具备强大的多模态处理能力,能够支持文本、图像等多种数据形式的联合分析与生成。此外,商汤科技还在多语言支持方面取得了突破,例如与泰国DTGO集团及其下属公司Quinnnova联合发布了“东风”泰语大模型(DTLM)。这是全球首个同时支持泰文、中文和英文三种语言的AI大语言模型,专注于为企业用户提供本地化的生成式AI服务,助力其降本增效。“东风”之名取自《三国演义》,象征中泰文化的交流与融合[^3]。 在产品层面,商汤科技推出了多模态对话交互平台“商量”(网址:https://chat.sensetime.com/),该平台结合视觉、语言等技术,为用户提供沉浸式的人机交互体验。尽管其实际表现尚可,但目前尚未展现出相较于其他主流平台的显著优势[^4]。 此外,商汤科技高度重视AI技术的行业落地,致力于将研究成果转化为实际应用。除了技术平台的建设,商汤也在产品设计和行业解决方案方面持续投入,力求通过AI技术推动各行各业的智能化转型。这种从技术研发到产业应用的闭环体系,使得商汤能够在多个垂直领域提供定制化的AI解决方案,真正实现“让AI服务人类”的愿景[^2]。 ### 商汤科技大规模人工智能模型的应用示例 - **企业服务**:通过“东风”泰语大模型(DTLM),商汤为泰国及东南亚地区的企业提供本地化的生成式AI服务,涵盖内容生成、客户服务、数据分析等多个场景。 - **人机交互**:多模态对话平台“商量”展示了商汤在自然语言处理和视觉识别方面的技术整合能力,适用于智能客服、虚拟助手等应用场景。 - **行业解决方案**:商汤将AI模型广泛应用于智慧城市、智慧交通、智慧医疗、智慧金融等领域,助力企业提升效率、优化决策。 ```python # 示例:使用商汤科技的AI模型进行多模态推理(伪代码) from sensetime_ai import MultiModalModel # 初始化多模态模型 model = MultiModalModel(model_name="SenseTime-DayDayUp") # 输入文本与图像 text_input = "请描述这张图片中的内容。" image_input = "path/to/image.jpg" # 进行多模态推理 response = model.infer(text=text_input, image=image_input) print(response) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值