行泊一体L2++方案实战
文章平均质量分 93
以实战为例,主打在项目和需求中寻求解决方案,是最好的学习路线,强化自己在深度学习和自动驾驶方面的技术能力。同时培养每一位工程师的全栈能力
Monkey PilotX
大厂来到Tier1拧螺丝的程序猿,我将分享我在高级驾驶辅助系统领域的经验,探讨最新的技术趋势,以及这些技术如何塑造我们的未来出行
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
把 7B 模型塞进车规级芯片:LoRA 在自动驾驶中的极限调参指南
虽然 LoRA 在训练阶段表现出色,但真正的挑战在于如何将其部署到资源受限的车载环境中,尤其是车规级芯片(如 NVIDIA Orin-X、华为 MDC、地平线征程系列)上。LoRA 已经在自动驾驶中展现出强大的微调能力,但它的潜力远不止于此。小鹏的 XNGP 系统强调“全国都能开”,通过 LoRA 插件实现 BEV 感知模型的城市级别微调,并结合任务调度系统进行插件管理。小米 SU7 在语音座舱中部署了 7B 规模的语言模型,通过 LoRA 插件实现个性化语义理解与导航推荐,适配不同用户的语音习惯。原创 2025-08-13 12:55:36 · 1392 阅读 · 0 评论 -
Self-Attention→BEVFormer:一张图看懂注意力在自动驾驶的十年进化史
最早的注意力机制由 Bahdanau 等人在机器翻译任务中提出,用于解决 RNN 编码器在长序列中信息压缩的问题。注意力机制并非始于 Transformer,它的历史可以追溯到序列建模的早期阶段,尤其是在自然语言处理(NLP)任务中。在自动驾驶系统中,注意力机制已经深入多个关键模块,从感知到决策,从多模态融合到轨迹预测。Transformer 并不只用一个注意力头,而是使用多个并行的注意力头,每个头可以学习不同的语义关系。在端到端自动驾驶架构中,注意力机制帮助模型从感知到控制的全过程中提取关键语义。原创 2025-08-12 12:16:54 · 771 阅读 · 0 评论 -
TopLiDM架构解析:DriveVLM如何融合VLM与E2E自动驾驶
自动驾驶技术近年来在感知、规划、控制等模块上取得了显著进展,尤其是端到端(End-to-End, E2E)方法的兴起,使得从传感器输入到轨迹输出的流程更加紧凑。尽管 TopLiDM 展现出强大的语义推理与规划能力,但在实际部署与持续优化过程中,仍面临一系列技术挑战。,它们通过引入大模型的语言理解能力,使自动驾驶系统具备“解释能力”和“推理能力”,不仅能输出轨迹,还能回答“为什么这么走”。的“思维链”过程,融合视觉语言模型(VLM)与传统 E2E 模型,实现更强的语义推理与决策能力。原创 2025-08-11 12:53:32 · 1147 阅读 · 0 评论 -
从检索到决策:RAG 在自动驾驶的工程化通关秘籍
在自然语言处理领域,RAG(Retrieval-Augmented Generation)常被理解为“检索 + 生成”的组合架构:先从外部知识库中检索相关信息,再将其作为上下文输入给生成模型,用于回答问题或生成文本。随着 RAG 技术在自动驾驶领域的落地,学术界和工业界涌现出多个具有代表性的框架。随着 RAG 在自动驾驶中的应用逐步深入,新的技术瓶颈也开始浮现。RAG 在自动驾驶中的应用,不仅是技术创新,更需要严谨的评估体系来验证其实际价值。RAG 在自动驾驶中的落地,不再是单一模块的优化问题,而是一个。原创 2025-08-08 09:45:00 · 1138 阅读 · 0 评论 -
VIL 不是神话:数字孪生在 Orin-X 上的端到端部署 Checklist
tegrastats是 NVIDIA Jetson 平台(包括 Orin-X)自带的轻量级资源监控工具;是专业的性能剖析工具,用于分析 GPU、CPU、内存等资源使用情况。原创 2025-08-07 09:45:00 · 1406 阅读 · 0 评论 -
卡尔曼滤波融合雷达与摄像头进行目标跟踪
本文教你如何通过卡尔曼滤波在ROS上进行实践原创 2025-08-01 09:45:00 · 828 阅读 · 0 评论
分享