深度剖析多任务模型 QAT 策略

地平线开发者

已于 2025-02-19 17:21:45 修改

阅读量660

点赞数 20

文章标签：自动驾驶算法

于 2025-02-19 15:34:42 首次发布

本文链接：https://blog.youkuaiyun.com/agorachenyun/article/details/145730780

版权

本文为笔者个人见解，如有不同意见欢迎评论

1.引言

为了节省端侧计算资源以及简化部署工作，目前智驾方案中多采用动静态任务融合网络，地平线也释放了 Lidar-Camera 融合多任务 BEVFusion 参考算法。这种多任务融合网络的浮点训练策略可以简述为：

首先在大量数据的条件下完成多任务模型 backbone 部分的浮点训练；

然后，固定 backbone 的权重，分别接多个 task head 进行单独的训练。

在这种浮点训练策略下，QAT（量化感知训练）里的 calibration（校准）和量化训练策略跟常规的单 task 模型差别较大。常规的单 task 模型一般就是用那种比较固定、普遍适用的训练办法，不过碰到复杂多变又有特定需求的情况，它的局限性就慢慢显现出来了。

这篇文章会结合具体的场景，对 calibration 和量化训练策略进行分析，然后提出一些笔者个人独特的看法，希望相关领域的研究和实践提供点有用的参考和启发。

2.量化训练策略

本文将以具有两个任务头 task_head1 和 task_head_2 的多任务模型为例进行描述。

2.1 步骤描述

此步骤的前提是模型已完成浮点训练。

在进行后续操作之前，必须确保模型已经成功地完成了浮点训练。只有在这个前提条件得到满足的情况下，才能保证后续的工作能够顺利进行，并且得到准确和可靠的结果。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

地平线开发者

关注关注

20
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

『大模型笔记』《Pytorch实用教程》（第二版）

AI新视界

07-07

678

时隔5年，历时4年，耗时2年的《Pytorch实用教程》第二版完成了。在第一版的精华之上，增加了丰富详实的深度学习应用案例和推理部署框架，使本书更系统性的涵盖深度学习工程师所涉及的知识面。如人工智能技术发展一浪接一浪，《Pytorch实用教程》第二版不是结束，而是开始，开启新的技术、新的领域、新的篇章，希望未来能继续与大家一起在人工智能技术里学习、进步。

Transformer 大模型的优化与性能提升策略全解析

加入“Super Entity”，与全能开发团队共探AI智能体与数字人项目，开启前沿技术之旅。

05-11

983

Transformer 大模型作为当今人工智能领域的核心技术之一，在众多领域展现出了巨大的应用潜力。然而，其部署和应用面临着诸多挑战，尤其是模型庞大带来的资源消耗问题。本文详细阐述了 Transformer 大模型优化的关键技术，包括模型量化、剪枝和知识蒸馏等，通过代码示例展示了这些技术的实际应用方法，并探讨了在不同场景下的优化案例以及需要注意的问题。

参与评论您还未登录，请先登录后发表或查看评论

深度学习实战——模型推理优化（模型压缩与加速）

05-29

1万+

本篇博客主要介绍几种模型推理优化方法的原理，并进行了代码实践与优化（内含代码与数据集）。

从训练到部署的全流程压缩工程最佳实践复盘 + 模型上线策略归纳

努力分享一些人工智能相关的知识干货！

04-16

653

> “我们该不该压缩？”、“怎么压缩最有效？”、“上线后怎么灰度发布与评估？” > > 本文作为《训练快、推理省》收官之作，将回顾整个压缩工程体系，从训练 → 量化剪枝 → 部署调度 → 性能调优 → 上线策略，提炼出一套通用的实战路径。 > > 无论你是模型训练者、部署工程师还是平台运维人员，都能在本篇找到属于你的系统答案。

深度学习模型：从基础到前沿的技术解析与实践指南

m0_60674045的博客

02-09

864

使用nn.Module作为基础，创建一个自定义的CNN结构。该结构应包含卷积层、池化层、激活函数（如ReLU）和全连接层。return x自注意力机制通过计算输入序列中不同位置之间的相似度，并生成加权向量表示，有效地捕捉了序列中的依赖关系。知识蒸馏和量化感知训练各有优势。知识蒸馏通过软目标和蒸馏温度的调整，能够有效提升学生模型的性能，但需要大量的训练数据和计算资源。量化感知训练则通过在训练过程中考虑量化误差，优化了模型的计算复杂度和存储需求，同时保持了较高的性能。

大模型 AI MaaS

hello.reader

04-01

970

MaaS（模型即服务）作为人工智能时代的一颗璀璨明珠，以其独特的方式将尖端技术从实验室带入现实世界。从云端部署的复杂架构到模型优化的精妙技术，从企业应用的广泛场景到伦理挑战的深刻反思，MaaS 不仅是一个技术工具，更是一个连接创新与责任的桥梁。在这篇博客中，我们深入探索了 MaaS 的方方面面，试图揭示它的潜力、局限以及未来的可能性。现在，让我们回顾其核心价值，并为技术从业者与社会公众提供一些启示。MaaS 的价值首先体现在它对 AI 普及的推动。

【云馨AI-大模型】模型压缩与优化全解：剪枝、量化、蒸馏技术深度剖析

起而行动，方能平定心中的惶恐

02-27

853

【代码】【云馨AI-大模型】模型压缩与优化全解：剪枝、量化、蒸馏技术深度剖析。

大语言模型

asd8705的专栏

07-07

873

Vicuna是在LLaMa-13B的基础上使用监督数据微调得到的模型，数据集来自于ShareGPT.com 产生的用户对话数据，共70K条。调整训练损失考虑多轮对话，并仅根据模型的输出进行微调。Alpaca是斯坦福在LLaMa-7B的基础上监督微调出来的模型，斯坦福是用OpenAI的Text-davinci-003 API配合self-instruct技术，使用175个提示语种子自动生成了52K条提示-回复的指示数据集，在LLaMa-7B上微调得到的模型，在8张80G的A100上训练了3小时。

A100实时推理优化与多场景计算加速策略

tiangang2024的博客

02-21

1041

"A100 GPU实时推理优化策略深度解析，探讨多场景计算加速技术路径。从软硬件协同优化到CUDA核心调度，详解高性能计算集群部署方案，结合TensorRT与Triton推理服务器的最佳实践，提供数据中心、边缘计算及AI云服务的性能提升方案，涵盖模型量化、动态批处理与混合精度训练等关键技术。"

【YOLOv8边界框回归的深度剖析】：从基础到高级技巧，优化你的模型训练

YOLOv5算法原理深度剖析：揭开单阶段目标检测的黑匣子，全面理解目标检测模型的原理和实现

[YOLOv5算法原理深度剖析：揭开单阶段目标检测的黑匣子，全面理解目标检测模型的原理和实现](https://www.seeedstudio.com/blog/wp-content/uploads/2022/08/8-1030x539.jpg) # 1. 目标检测概述 ### 1.1 目标检测...

【MPC控制 - 从ACC到自动驾驶】车辆纵向动力学建模与离散化：MPC的“数字蓝图”

最新发布

qq_38961840的博客

05-24

378

深入了解车辆纵向动力学建模与离散化，这是构建MPC（模型预测控制）自动驾驶系统的关键“数字蓝图”。本文详细解析了影响车辆纵向运动的各种力，如何将复杂的物理系统抽象为简洁的状态空间数学模型，以及为何需要将连续模型离散化以供数字计算机处理。了解状态空间矩阵 (A, B, C, D) 的意义和零阶保持器 (ZOH) 离散化方法，为设计高精度、高效率的ACC（自适应巡航控制）及更高级别自动驾驶控制器奠定坚实基础。掌握这些核心概念，让你的控制系统之路更加顺畅。

Python如何赋能自动驾驶地图构建？从点云处理到实时导航

Echo_Wish

05-24

摘要： Python凭借强大的数据处理能力和丰富的开源生态，成为自动驾驶高精度地图构建的核心工具。文章解析了Python在点云处理（Lidar数据降噪与可视化）、SLAM算法（基于OpenCV的特征匹配）、路径规划（A*算法实现）等关键环节的应用，并展望了多传感器融合、深度学习动态更新等前沿趋势。通过Python，自动驾驶系统实现了从环境感知到实时导航的全链路智能化，推动高精度地图向更高准确性、动态化方向发展。（149字）

【MPC控制 - 从ACC到自动驾驶】ACC系统原理与MPC初步认知

qq_38961840的博客

05-24

700

本文深入探讨了自适应巡航控制（ACC）系统的原理及其在自动驾驶中的作用。我们解析了ACC如何通过速度和距离控制模式实现智能跟车和定速巡航，重点介绍了经典的恒定时距（THW）安全距离模型及其计算公式。文章还初步介绍了模型预测控制（MPC）这一强大的控制算法，阐述了其基于模型预测、滚动优化和约束处理的核心思想，并解释了MPC为何特别适用于ACC等高级驾驶辅助系统及自动驾驶的复杂控制需求。通过理解ACC和MPC，读者将认识到车辆智能化控制的关键技术，为后续深入学习自动驾驶控制奠定基础。

Python在自动驾驶数据清洗中的应用

Echo_Wish

05-19

575

在自动驾驶领域，数据清洗是确保系统稳定性和安全性的关键步骤。自动驾驶涉及多种传感器数据，如LiDAR、摄像头、IMU、GPS和CAN总线数据，这些数据通常存在噪声、缺失值、不一致格式和异常点。Python结合Pandas、NumPy和Scipy等工具，能够有效处理这些数据问题。数据清洗的核心步骤包括缺失值处理、噪声过滤、数据标准化、异常值检测和数据对齐。通过代码示例展示了如何填充缺失值、平滑噪声数据、归一化数据以及检测异常值。数据清洗不仅提升数据质量，还直接影响深度学习模型的收敛速度和系统安全性。随着技术的

车道线检测：自动驾驶的“眼睛”

weixin_41544125的博客

05-20

813

在目标检测中，锚框是预定义的边界框，用于表示可能的目标位置和形状。类似地，在基于锚点的车道线检测中，锚点是预定义的线段，用于表示可能的车道线位置和形状。锚生成：在图像上生成预定义的锚点。这些锚点可以是直线或曲线，具体取决于车道线的形状和方向。通常，会根据数据集的统计信息来设计锚点，以便它们能够覆盖各种可能的车道线形状。锚“移位”/偏差：模型预测锚点的调整，使其与实际车道线对齐。这包括调整锚点的位置、形状和大小，以更好地匹配图像中的车道线。非极大值抑制（NMS）

w~自动驾驶~合集3

whaosoft~aiotの开发板商城

05-20

981

在所提出的定制交通仿真管道中，构建了一个轨迹生成函数库来微调LLM，这有助于将用户提示转移到不同的代理轨迹中，包括切入和掉头等动作。此外，该管道包含HDMap生成器，用于仿真背景道路结构。在此阶段，先前生成的代理轨迹充当条件输入，确保生成的HDMap符合流量约束。在下文中，我们将详细介绍LLM的微调过程和HDMap生成器的框架。用于轨迹生成的微调LLM以前的交通仿真方法需要复杂的参数规范，包括代理的速度、位置、加速度和任务目标等细节。

Python在自动驾驶中的多传感器融合——让智能汽车“看得更清楚”

Echo_Wish

05-23

216

在自动驾驶技术的演进过程中，多传感器融合（Multi-Sensor Fusion）是不可或缺的一环。单一传感器往往存在局限性，例如**摄像头怕光线变化，激光雷达价格昂贵，毫米波雷达分辨率有限**，但如果将它们结合起来，就能形成一个更全面、更可靠的环境感知系统。今天，我们就来聊聊如何**用Python实现自动驾驶中的多传感器融合**，并结合最新技术趋势，带你一窥智能汽车如何“看清世界”。

Python与自动驾驶数据集处理：构建智能驾驶的基石

Echo_Wish

05-22

279

Python在自动驾驶数据集处理中扮演着核心角色，帮助应对多模态数据、数据量巨大、清理标注复杂及实时性要求高等挑战。通过Python，开发者能够进行数据清理与预处理、数据增强、点云处理、图像处理和时间序列分析等任务。代码示例展示了如何使用Python处理LiDAR点云数据、进行图像增强以及分析GPS轨迹。未来趋势包括云计算与边缘计算的结合、Transformer模型的应用以及数据隐私与安全的关注。Python的灵活性和强大功能使其成为构建智能驾驶基石的不可或缺工具。