- 博客(514)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 深度学习:淘气3000问
淘气3000问LZ每天学习深度学习各种知识,其实会遇到各种各样的问题,每次都百度还是挺麻烦的,想做个汇总博客,总结各种深度学习遇到的问题。有些很简单,做个积累,有些还是比较复杂的,那就好好研究一下吧!1. BatchNorm是什么?2. BatchNorm里面的momentum有什么用?3. 目前常用的backbone有哪些?分别是什么样的呢?4. 常用的激活函数有哪些?分别是什么呢?5. DLA(Deep Layer Aggregation)是什么?为什么要用这种结构?6. DCN(Defo
2020-09-08 18:46:18
800
1
原创 c语言入门到c++使用高手(课程笔记+案例链接)(2020年6月23日更新类第四,五节)
c语言入门到c++使用高手(课程笔记+案例链接)一、引言在学校里还是python,matlab用惯了,c++用起来还是没有得心应手,很多c++11的用法也没有理解的很清楚,所以LZ准备花半年左右的时间,利用课余的时间系统的学习一下c语言到c++的一系列知识,哪怕是再基础的知识也准备重新走一遍,夯实下基础,这篇博客其实就是学习笔记+案例的一个目录,后续会持续更新这篇博客,当然也会更新对应一系列的...
2020-04-08 09:23:46
1388
2
原创 【自动驾驶基础】LDM(Latent Diffusion Model) 要点总结
计算复杂度问题像素空间中的扩散模型计算成本极高训练和推理都需要大量资源限制了模型的可访问性和应用细节与效率的权衡需要在复杂度降低和细节保留之间找到平衡过度压缩会丢失细节不压缩则计算成本过高条件生成灵活性需要支持多种条件输入(文本、边界框等)需要实现高分辨率合成的卷积方式首次在潜在空间中训练扩散模型,实现计算效率和质量的最佳平衡引入交叉注意力机制,支持灵活的条件生成优化下采样策略,在复杂度降低和细节保留之间达到近最优平衡两阶段训练策略,通用自编码器可重用于多个任务。
2025-12-21 12:52:43
623
原创 【自动驾驶】RAD 要点总结(地平线)
首次提出3DGS-based RL框架用于训练端到端AD策略创新结合RL和IL,实现协同优化,RL补充IL的因果关系建模,IL补充RL的人类对齐设计专门的安全奖励和密集辅助目标,解决稀疏奖励问题在闭环评估基准上验证有效性,碰撞率相比IL方法降低3倍提供完整的训练框架,包括奖励设计、动作空间优化、训练策略等。
2025-12-21 12:17:52
810
原创 【自动驾驶】SparseWorld-TC 论文总结(理想)
离散化限制:基于VAE的方法使用离散标记,限制了连续空间表示能力几何先验依赖:BEV投影方法过度依赖显式几何先验,限制了模型的灵活性时空依赖性捕捉不足:传统方法难以有效捕捉复杂的时空依赖关系多帧预测能力有限:现有方法在预测多帧未来占用时表现不佳首次提出轨迹条件的稀疏占用世界模型,实现了端到端的多帧未来占用预测绕过BEV投影和离散化,采用稀疏占用表示,提升了模型的表示能力和计算效率基于Transformer的架构,有效捕捉时空依赖性,无需显式几何先验在nuScenes基准测试上达到SOTA性能。
2025-12-21 11:43:08
980
原创 [自动驾驶] 小鹏 FutureX 要点总结(小鹏)
现有端到端系统仅基于当前场景进行单次前向预测,在高度动态的交通环境中可能产生次优响应自车行为会改变未来场景,需要推理未来场景演化。
2025-12-21 11:11:10
758
原创 Sparse4D Track Query 理解与其他E2E tracking方法横评
隐式跟踪:不使用显式的 track query,通过实例传播实现基于置信度:选择高置信度实例进行跟踪时序融合:通过 temporal GNN 融合时序信息端到端:在模型内部完成,无需后处理。
2025-12-13 12:49:13
709
原创 检测中 Denoising Training (去噪训练) 怎么理解?
Denoising Training 的核心:生成带噪声的 GT:从真实 GT 添加随机噪声明确的监督信号:这些 noisy anchors 的目标是原始 GT增加正样本:所有 noisy anchors 都是正样本加速收敛:提供更好的训练信号不是真正的"去噪",而是"从噪声中恢复"噪声尺度需要仔细设计(位置大,尺寸小)使用 attention mask 控制不同 instances 的交互可以显著加速训练并提高性能就像给模型一些"模糊的答案"(带噪声的 GT)
2025-12-13 12:37:13
900
原创 检测中的Reference Point (参考点)怎么理解?
Reference Point 是3D 空间中的一个点特征采样的参考位置:用于从多视角图像特征图中采样特征回归的起始点:用于预测目标边界框的偏移量空间位置的编码:提供位置信息给 Transformer 的 attention 机制特性Sparse4DReference Point 形式单一 3D 点多个 Key Points数量1 个/query多个/anchor (如 9 个)初始化可学习参数从 anchor 生成更新方式逐层迭代更新随 anchor 一起更新采样方式。
2025-12-13 12:27:47
994
原创 Sparse4D 时序输入和 Feature Queue 详解
Sparse4D 使用时序融合机制来处理多帧数据,通过类管理时序实例和 feature queue。本文将详细解释时序输入和 feature queue 的结构。
2025-12-13 12:17:58
403
原创 Pytorch中的ebmedding到底怎么理解?
是 PyTorch 中实现嵌入操作的核心模块,它将离散符号映射到连续的语义空间,是处理符号数据的基础工具。通过训练,模型可以自动学习符号之间的语义关系(例如相似性)。它通常用于自然语言处理(NLP)任务(如词嵌入)、处理分类特征,或任何需要将离散索引转换为密集向量的场景。在 PyTorch 中,
2025-03-02 15:19:08
586
原创 MotionLM技术路线与优势解析
其技术路线为自动驾驶提供了一种更灵活、可解释的预测框架,未来或进一步融合多传感器数据(如LiDAR、摄像头),提升复杂场景的适应性。是由 Google 在 2023 年提出的基于语言模型(LM)架构的生成模型,主要用于自动驾驶场景中的交通参与者(如车辆、行人)其核心思想是将轨迹预测问题转化为类似自然语言生成的序列建模任务,通过借鉴语言模型的技术路线实现多模态、可控且高效的预测。轨迹Token可对应具体的驾驶行为(如“变道”“减速”),使模型决策过程更透明,便于调试和验证。
2025-02-27 23:04:30
606
原创 评估自动驾驶(AD)策略性能的关键指标
一系列用于评估自动驾驶(AD)策略性能的关键指标。让我们逐一解析这些指标:动态碰撞比率(Dynamic Collision Ratio, DCR):静态碰撞比率(Static Collision Ratio, SCR):碰撞比率(Collision Ratio, CR):位置偏离比率(Positional Deviation Ratio, PDR):航向偏离比率(Heading Deviation Ratio, HDR):偏离比率(Deviation Ratio, DR):平均偏离距离(Average De
2025-02-27 23:01:13
1742
原创 智驾大模型常见技术指标及含义
以上指标与论文反映了智驾大模型在提升安全性、效率及泛化能力方面的核心进展。如需进一步了解具体模型实现或数据集细节,可参考相关论文及企业技术报告(如特斯拉AI Day、华为智能驾驶白皮书)。智驾大模型的技术指标主要围绕。
2025-02-27 22:58:52
1445
原创 3D Gaussian Splatting(3DGS)的核心原理
通过显式的高斯分布建模,在实时性、动态场景适应性和多传感器融合方面展现出独特优势,成为自动驾驶三维感知的理想工具。其高效的渲染能力和灵活性,使其在实时建图、障碍物检测、仿真测试等场景中具有广阔应用前景。随着算法优化与硬件升级,3DGS有望成为自动驾驶三维感知的新一代核心技术。
2025-02-23 15:59:00
4411
1
原创 自动驾驶中planning为什么要把横纵向分开优化?
联合优化横向和纵向需要高维状态空间搜索(如同时优化位置、速度、航向角),计算复杂度呈指数级增长。尽管存在耦合场景的局限性,但在当前技术阶段,这一策略仍是工程实践中的主流选择。从动力学模型来看,横向和纵向的控制输入(如方向盘转角、油门/刹车)对车辆状态的影响。分拆后,两者可分别采用最适合的算法(如横向用样条插值,纵向用模型预测控制 MPC)。将车辆运动投影到车道中心线的切向(纵向)和法向(横向),生成横向位移的平滑轨迹。分离开横向和纵向优化,可以更清晰地定义约束条件,避免联合优化时的复杂耦合。
2025-02-23 15:45:47
1762
1
原创 为什么基于高斯的表示方法(Gaussian-based Representations)在建模城市场景中有效?
基于高斯的表示方法(如3DGS)通过显式、可编辑的3D高斯分布,在城市场景建模中实现了。
2025-02-23 12:51:25
1226
原创 如何理解模仿学习(Imitation Learning, IL)
是一种机器学习范式,其核心目标是让智能体(如自动驾驶车辆、机器人)通过观察专家(如人类驾驶员)的示范行为,学习模仿专家的决策策略。与强化学习(RL)依赖环境奖励信号不同,IL直接从专家提供的状态-动作对中学习映射关系,属于监督学习的扩展。
2025-02-22 14:04:58
1909
原创 2024.12.14随想
回过头来看智己的第一辆车要40w+,定位的是轻奢,对标的是特斯拉,现在也慢慢放下身段,全员上阵做销售,现在车的品牌太多了,说到底,一年会诞生出很多新的汽车品牌,一年又会消失很多,本着创一个牌子,搞一个公司,拉一波融资,整的好上市,整的不好有可能是整合,整的不好,就原地解散。其实这个问题主要看的是无效内卷,还是真的要做事。最近的一年,汽车圈的日子都不是很好过,尤其是最近闹的沸沸扬扬的极越汽车原地解散,之前还有禾多,合众,宝马i3也降到了20w以内,以前的bba,现在好像也走起了新价比,这其中的原因是啥?
2024-12-14 13:21:02
422
原创 2024.12.11 随想
说到识人,lz多少还是经验比较浅的,自认为做mentor,为下面的同学取谋取福利,这点还是做的不错的,但是也会遇到一些小同学,有些自我预期会很高,有些小心思会比较多,也有一些很老实,哈哈哈哈,会发现高一个纬度看,每个人都是一个独立的个体,每个人都不一样,好像是废话。今天和mentor聊天,发现mentor的各方面认知是远远高于lz的,知人善用这个点,真的非常重要,mentor聊到不同的tl,不同的性格,不同的做事风格,不同的习惯,但是每个人又可以用到恰到好处,这点真的佩服。
2024-12-12 00:05:34
387
原创 2024.12.10 随想
早上起来运动了10min,也正常吃了早饭,就是现在这个算是迪拜作息了,正常有四个小时的时差了,下次得倒腾下,争取来个日本的时差,也就1个小时还能接受,正常小伙伴我感觉23点都睡了,想想lz,12:40了,在这疯狂敲键盘,顺道还分析了case,回复了群里消息,嗯,下次得改改,早上回!
2024-12-11 00:41:58
270
原创 乱七八糟:工作快五年的一点点想法
之前,LZ每年都会进行复盘,回顾过去一年中工作,生活的点点滴滴,有做的好的地方,也有可以改进的地方,就像lz说的,尽人事,听天命,每天进步一点点。虽然博客上面的更新变少了很多,确实,一部分时候是因为懒🤣,三年前lz其实跳槽了,所以整个公司的节奏,生活都和之前不太一样,所以一些技术文档,就写在公司的内部空间里面,也就没有搬出来,后面有机会慢慢把这两年欠的博客补回来吧。
2024-05-03 14:52:17
726
2
原创 Paper reading:Fine-Grained Head Pose Estimation Without Keypoints (CVPR2018)
Paper reading:Fine-Grained Head Pose Estimation Without Keypoints (CVPR2018)一、 背景为什么要读这篇论文,因为LZ之前要做头部姿态估计,看到一些传统的方法,都是先进行人脸检测,然后再进行关键点定位,当然现在可以一起做,anyway,得到最后的关键点位置,再使用一个通用的3D人脸模型,通过solvePnP来得到最终的头部姿态,但是不管是脑子中考虑还是最后的动手实践,得到的结论就是这种方式的头部姿态方法不robust。可以想一下:每
2022-12-06 13:32:13
1101
原创 VSCODE:代码块折叠设置
LZ在使用vscode的时候,出现代码块无法折叠的问题,这个对于比较长的脚本,阅读起来非常不友好,于是找了个方法,很简单,做个记录。修改EditorFoldingStrategy选项的值为indentation。在输入框输入folding,文件->首选项->设置。小技巧,写了备查就行!...
2022-07-25 11:20:00
4106
2
原创 乱七八糟:程序员(媛)请保护好自己
LZ并不是标题档,只是有感而发,终极的目标就是,程序员(媛)们请保护好自己,尤其是应届生,要明白领导是真的器重你,还是说在对你使用PUA。
2022-07-24 16:03:15
1468
3
原创 自动驾驶:常用缩写对照表(持续补充中。。。)
常用词汇持续积累中。。。 英文缩写 中文全称 英文全称 ABS 防抱死制动系统 Anti-lock Braking System ACCS 自适应巡航控制系统
2022-05-07 11:43:51
3674
matlab 蚁群算法报错 小白求助
2016-07-09
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅