- 博客(27)
- 收藏
- 关注
原创 MIT-BEVFusion系列九--CUDA-BEVFusion部署5 update、矩阵逆运算、预计算
update是cudabevfusion中非常重要的一部分。
2024-03-03 16:23:30
1565
1
原创 MIT-BEVFusion系列九--CUDA-BEVFusion部署4 c++解析pytorch导出的tensor数据
流用于表示一系列的命令(如内存传输命令和核函数执行命令)在 GPU 上的执行顺序。流中的命令按照它们被插入的顺序在 GPU 上执行,但不同流中的命令可以并行执行。这部分用于打印这四个 engine 的信息,包含模型名称和绑定点的信息(输入输出是否为动态形状,输入输出节点索引、名称、维度和类型)。本章的重点在于pytorch导出的tensor数据的解析。这里会打印出执行CUDA-BEVFusion时,终端打印的信息中的网络信息。通过数据的读取,我们可以大致看一下作者是如何设计的。,即具体的数据的起始地址。
2024-02-23 23:59:47
1586
2
原创 MIT-BEVFusion系列九--CUDA-BEVFusion部署3 create_core方法1
create_core的另一个重要作用,反序列化engine
2024-02-22 13:26:22
1409
原创 MIT-BEVFusion系列九--CUDA-BEVFusion部署2 create_core之参数设置
cuda-bevfusion中的参数设置
2024-02-20 00:00:13
1558
原创 MIT-BEVFusion系列九--CUDA-BEVFusion部署1 debug代码
本文介绍了debug。cuda-bevfusion代码的设置问题
2024-02-19 23:58:41
1415
1
原创 MIT-BEVFusion系列八--onnx导出2 spconv network网络导出
encoder_layers 中包含了 4 个 layer,前 3 个 layer 包含了 2 个 SparseBasicBlock 和 1 个 SparseConvolutionQuant (sparseconv 融合了 bn 和 relu,原先是一个 SparseSequential),最后 1 个 layer 仅包含 2 个 SparseBasicBlock。SparseBasicBlock 内部就是 2 个 SparseConvolutionQuant 和 ReLU。
2024-02-16 16:23:36
1508
2
原创 MIT-BEVFusion系列七--量化1_公共部分和激光雷达网络的量化
本文是Nvidia的英伟达发布的部署MIT-BEVFusion的方案的解析
2024-02-05 13:22:50
1761
1
原创 Far3D: Expanding the Horizon for Surround-view 3D Object Detection 论文翻译
最近,环视图像的 3D 对象检测因其低部署成本而取得了显著进展。然而,大部分研究主要集中在近距离感知范围,而远距离检测则较少被探索。and将现有方法直接扩展以覆盖远距离带来了重计算成本和不稳定收敛**等挑战。为了解决这些限制,本文提出了一种新颖的基于稀疏查询的****框架,称为Far3D。通过利用高质量的2D 对象先验知识,我们生成了补充3D 全局查询的3D 自适应查询。为了有效捕获不同视图和尺度下远距离对象的判别特征,我们引入了一个感知视角的聚合模块。to此外,我们提出了一种。
2024-02-05 11:45:46
1220
1
原创 Simple-bev论文纯翻译--前三章
摘要— 在自动驾驶车辆中构建不依赖于高密度激光雷达(LiDAR)的3D感知系统是一个关键的研究问题,因为与相机和其他传感器相比,激光雷达系统的费用较高。lifted最近的研究已经发展出各种仅使用摄像头的方法,其中特征可区分地从多摄像头图像中“抬升”到二维地平面,生成车辆周围3D空间的“鸟瞰图”(BEV)特征表示。这一领域的研究产生了各种新颖的“抬升”方法,但我们观察到培训设置中的其他细节同时发生了变化,使得在表现优异的方法中究竟哪些因素真正重要变得不清晰。
2024-02-05 11:21:26
1150
1
原创 MIT-BEVFusion系列五--Nuscenes数据集详细介绍,有下载好的图片
nuScenes 数据集 (pronounced /nu:ːsiː:nz/) 是由 Motional (以前称为 nuTonomy) 团队开发的自动驾驶公共大型数据集。nuScenes 数据集的灵感来自于开创性的 KITTI 数据集。nuScenes 是第一个提供自动驾驶车辆整个传感器套件 (6 个摄像头、1 个 LIDAR、5 个 RADAR、GPS、IMU) 数据的大型数据集。与 KITTI 相比,nuScenes 包含的对象注释多了 7 倍。
2024-02-03 13:02:33
9884
1
原创 MIT-BEVFusion系列四-2:BEVFusion:Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View论文中英文对照(第三章)
各传感器特点相机:cameras capture rich semantic information摄像头捕捉丰富的语义信息Lidar: LiDARs provide accurate spatial information激光雷达提供准确的空间信息RADAR:radars offer instant velocity estimation雷达提供即时的速度估计为啥要融合。
2024-01-31 16:44:28
1492
原创 MIT-BEVFusion系列四-1:BEVFusion:Multi-Task Multi-Sensor Fusion with Unified Bird’s-Eye View论文中英文对照(前两章)
多传感器融合对于准确和可靠的自动驾驶系统至关重要。最近的方法基于点级融合:用摄像头特征增强激光雷达点云。the然而,摄像头到激光雷达的投影丢弃了摄像头特征的语义密度,这阻碍了这种方法的有效性,特别是对于语义导向的任务(如3D场景分割)。在本文中,我们用BEVFusion打破了这一根深蒂固的传统,BEVFusion是一个高效和通用的多任务多传感器融合框架。它在共享的鸟瞰视图(BEV)表示空间中统一了多模态特征,从而很好地保留了几何和语义信息。为了实现这一点,我们通过。
2024-01-31 16:44:09
1340
原创 MIT-BEVFusion系列一:初见
2021 年是自动驾驶开启商业化的元年,自动驾驶进入商业化探索的快车道,主要的国家加快政策法规突破以促进自动驾驶商业化。: 英伟达发布的部署MIT-BEVFusion的方案,以惊人的25FPS同时保持67.66的高精度mAP运行在Orin上。: 特指MIT提供的BEVFusion融合方案,2022年5月26日发布的论文,是一个多任务多传感器融合框架。BEVFusion属于配备了多种传感器,使用多种传感器融合的自动驾驶系统方案,也同样极具竞争力。特斯拉代表的纯视觉方案,在自动驾驶领域独树一帜。
2024-01-31 11:57:37
2297
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人