自动驾驶热点VLM（视觉语言模型）！又一次突破！

最新推荐文章于 2025-10-17 12:05:51 发布

转载最新推荐文章于 2025-10-17 12:05:51 发布 · 804 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2NzUxNTU1OA==&mid=2247625374&idx=2&sn=b8ba068d14e04c270eb62e0b720518e3&chksm=cf12211f74c958fc9f171b1eebc1466f6a04edf6945945eeada05d6edd5a22e803edcd0b6ac7&scene=126&sessionid=0

文章标签：

#自动驾驶 #语言模型 #人工智能 #机器学习 #自然语言处理

自从谷歌提出ViT、Open AI发布CLIP，视觉语言模型（VLM）便成为了研究热点，凭借跨模态处理和理解能力，以及零样本学习方法，为CV领域带来了重大革新，今年CVPR'24自动驾驶挑战赛中，VLM也是参赛人数最多的赛道，围绕环境感知提升等，应用方案百花齐放，而为了性能不变下压缩模型体量，CVPR'24收录了一项突破性工作，VLM提示蒸馏新方法PromptKD！

为了帮助大家综合掌握，集VLM、知识蒸馏、提示工程一体的创新成果，研梦非凡于9月4日晚（周三），邀请了从事多模态大模型研究的王导师，独家详解来自南开&蚂蚁集团的CVPR'24研究《PromptKD：基于提示学习的VLM蒸馏新方法！》（AI前沿直播课NO.65），从VLM、Knowledge Distillation、Prompt Learning的知识回顾，到PromptSRC等顶会相关工作，重点讲解PromptKD方法原理、提示蒸馏过程及实验研究，1节课get前沿视野及论文idea！

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取300篇精选论文（50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM）+文末还有算力等科研福利！

unsetunset直播课内容概览unsetunset

01 研究背景

关注的问题
本文主要贡献

无监督领域特定提示驱动知识蒸馏
预存储文本特征
教师-学生范式
广泛的实验验证

02 知识准备

视觉语言模型（VLM）

经典模型CLIP介绍
CLIP特点与架构

知识蒸馏（Knowledge Distillation）

什么是知识蒸馏？
为什么要知识蒸馏？
知识蒸馏的原理：Teacher、Student模型
知识蒸馏的分类：基于目标、基于特征的蒸馏

提示学习（Prompt Learning）

Prompt-Tuning的优缺点
Prompt-Tuning的代表性工作

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取300篇精选论文（50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM）+文末还有算力等科研福利！

03 相关工作

PromptSRC（ICCV'23）

简介：自我调节的提示学习框架，解决了提示过拟合问题，以实现更好的泛化
框架原理

04 PromptKD详解（CVPR'24）

方法简介
两阶段训练流程

Prompt Learning
通过促进快速模仿来启动蒸馏过程，鼓励学生模型生成与教师模型相似的预测

伪代码

05 实验研究

实验一

实验指标、数据集等
实验设置

实验二

实验流程

消融实验

06 总结和展望

导师介绍

王导师

【学术背景】985硕出身，拥有丰富的深度学习研究、论文发表经验，多篇SCI论文、EI会议论文（一作）

【研究方向】大语言模型、视觉语言模型、多模态学习，以及自然语言处理、进化算法等

👇🏻扫描二维码找助教0元预约直播课！

凡预约即可免费领取300篇精选论文（50篇VLM蒸馏+50篇提示工程+100篇多模态+100篇LLM/VLM）+文末还有算力等科研福利！

unsetunset研梦非凡科研论文指导方案unsetunset

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

👇🏻扫描二维码咨询助教两种指导方案

unsetunset研梦非凡部分导师介绍unsetunset

研梦非凡导师团队，来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

👇🏻扫码加助教为你匹配合适课题的大牛导师

unsetunset研梦非凡科研福利unsetunset

🌟90分钟人工智能零基础入门课免费领

🌟7小时科研论文写作系列课免费领

🌟年度会员福利价129元（原价2999）

🌟50小时3080GPU算力免费领

🌟百篇8月论文资料大合集免费领

👇🏻 扫码领取以上5重粉丝专属科研福利！

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。