- 博客(358)
- 资源 (5)
- 收藏
- 关注

原创 几位无人驾驶领域的杰出科学家
本文介绍几位全球杰出的无人驾驶科学家们,大家可以关注他们的主页,及时的了解无人驾驶行业最新动态。(还有很多杰出的科学家,这里不一一列举了,暂时只列举出4位科学家,3位外国科学家+1位中国科学家)目录1.Sebastian Thrun2.Andreas Geiger3.Raquel Urtasun4.Huang Yu1.Sebastian Thrun关于Sebastian Thrun的资料,网上资料比较多,谷歌无人车之父,现在是UDACITY创始人,国内有很多自动驾驶工程师.
2020-06-29 23:55:42
2724

原创 Python开发常用工具库
Pythonhttps://www.python.org/doc/numpyhttps://numpy.org/devdocs/pytorchhttps://pytorch.org/docs/stable/index.htmlscikit-imagehttps://scikit-image.org/docs/stable/picklehttps://docs.p...
2020-04-12 21:40:42
1107
原创 从零实现3D自动标注:MS3D、MS3D++
自动标注利器!MS3D++ 挑战悉尼超复杂人流检测性能~本文主要介绍如何使用进行3D自动化标注。目前开源的常用激光雷达数据集有KITTI、NuScenes、Waymo、ONCE、Argoverse2。当我们在自采数据集上进行3D检测模型开发时,一个头疼的问题就是如何进行标注。一个自然而然的想法就是使用开源的LiDAR检测模型在我们的数据上进行推理,生成3D框,保留置信度比较高的3D框作为真值。然而,由于KITTI数据量比较少(只有7481帧)、类别种类很少,很难满足需求;
2025-03-29 22:42:14
335
原创 Andrej Karpathy 最新AI讲座(3个半小时):Deep Dive into LLMs like ChatGPT(深入探索像ChatGPT这样的大语言模型)
【必看珍藏】2月6日,安德烈·卡帕西最新AI普及课:深入探索像ChatGPT这样的大语言模型|Andrej Karpathy。
2025-02-16 23:47:42
689
原创 (已开源-ECCV24) 弱监督点云图像3D检测模型:Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance
本文介绍一篇点云图像自监督3D检测模型:VG-W3D。弱监督3D目标检测旨在学习一个标注成本低的3D检测器,例如使用2D标签。与之前的工作仍然依赖于很少准确的3D标注不同,本文对 KITTI 数据集进行了广泛的实验,以验证所提出的三个约束的有效性。在不使用任何 3 D标注的情况下,本文的方法与最先进的方法相比取得了良好的性能提升。
2025-01-12 15:56:46
339
原创 (已开源-AAAI25) RCTrans:雷达相机融合3D目标检测模型
在雷达相机融合三维目标检测中,,在相机雷达融合过程中提出了很多挑战。为了解决这个问题,我们引入了一种新的基于query的检测方法。
2025-01-05 14:50:06
1134
原创 (已开源) 详解4D Radar数据集K-Radar
本文介绍一个4D Radar公开数据集:KAIST-Radar(简称K-Radar,由AVELab提供)是一个新型的大规模目标检测数据集和基准测试集,包含35000帧4D雷达张量(4DRT)数据。
2024-12-15 15:50:38
996
转载 30家自动驾驶头部公司论文总结(2024-12-7)
大佬的总结,推荐大家关注一下大佬,除了自动驾驶头部公司企业论文总结,还总结了自动驾驶各个研究方向的论文,感兴趣的可以多去看看。
2024-11-28 21:30:52
157
原创 (已开源-ECCV2024)BEV检测模型-LabelDistill,使用真值进行知识蒸馏
项目链接:https://github.com/sanmin0312/LabelDistill (中文版翻译)文章目录1. Introduction & Related Work2. Method & Code3. Experiments3.1 Main Results3.2 Ablation Study1. Introduction & Related Work2. Method & Code3. Experiments3.1 Main Results
2024-10-21 19:23:54
416
原创 MIT 6.5940 EfficientML.ai Fall 2023: Lab 1 Pruning
本文是EfficientML.ai Fall 2023课程作业1练习答案,在本次练习里将会对经典的分类神经网络进行处理,减少模型大小和延迟。
2024-09-01 18:20:08
566
原创 (已开源-CVPR 2024)YOLO-World: Real-Time Open-Vocabulary Object Detection
然而,它们通常是在预先定义好的目标类别上进行训练,很大程度上限制了它们在开放场景中的可用性。为了解决这一限制,我们引入了 YOLO-World,这是一种创新的方法,通过视觉语言建模和大规模数据集的预训练来增强 YOLO,具有开放词汇检测能力。具体来说,我们提出了一种新的可重新参数化视觉语言路径聚合网络(RepVL-PAN)和区域-文本对比损失,以促进视觉和语言信息之间的交互。在具有挑战性的LVIS数据集上,YOLO-World在V100上实现了35.4 AP,在精度和速度方面都优于许多最先进的方法。
2024-09-01 15:45:54
807
原创 (ICRA 2024) Diffusion-Based Point Cloud Super-Resolution for mmWave Radar Data
使用提出的LiDAR点云监督的。
2024-05-27 19:41:07
1518
原创 (已开源-ICRA2023) High Resolution Point Clouds from mmWave Radar
本文提出了一种用于生成的方法:RadarHD,端到端的神经网络,用于从低分辨率雷达构建类似激光雷达的点云。本文通过在大量原始雷达数据上训练 RadarHD 模型,同时这些雷达数据有对应配对的激光雷达点云数据。本文的实验表明,即使是在未遇见过的场景以及存在严重烟雾遮挡的情况下,RadarHD也能生成丰富的点云数据。同时,这些生成的点云也能应用于现有的激光雷达里程计和建图方法中。
2024-05-26 21:35:42
856
原创 自动驾驶感知、端到端论文集(2024-10-11)
1. DetectionCVPR2024 - RadarDistill: Boosting Radar-based Object Detection Performance via Knowledge Distillation from LiDAR Features;Paper;CVPR2024 - RCBEVDet: Radar-camera Fusion in Bird’s Eye View for 3D Object Detection ;Paper;CodeICCV2023 - CRN: C
2024-03-26 19:41:39
827
转载 面向端到端自动驾驶的稀疏感知通用架构探索
在Sparse4D中,最重要的一个模块是Deformable 4D Aggregation可并行的4D特征聚合模块。这个模块主要负责Instance和时序图像特征之间交互。如图所示,主要包括三个步骤:第一点是4D关键点生成。
2023-11-04 16:39:29
850
转载 基于征程5芯片的BEV感知方案与部署实践
随着2021年征程5芯片的发布,我们基于征程5芯片设计了 BEV的感知原型方案,输入的是车载多视角的图像序列或者多模信号,在网络内部进行时空双维度的中融合(middle fusion),使得神经网络能够原生输出鸟瞰视角下的动静态感知、预测结果。下面是一个框架图。绿底部分表示纯视觉的信号处理,输入的是各摄像头的图像,经过第一阶段的模型提取图像特征,通过视角转换做 BEV视角下的多视角空间融合;再对BEV的特征进行时序融合,进而送入第二阶段做BEV上的特征提取;最后,输入到head部分做感知要素的输出。
2023-09-07 21:50:27
1977
原创 详解KITTI视觉3D检测模型CMKD: Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection
论文收录于。
2023-05-29 21:44:59
1982
转载 基于征程5芯片的Transformer量化部署实践与经验
杨志刚首先介绍了Transformer发展趋势及在嵌入式智能芯片上部署的问题,之后重点讲解了以征程5为例的嵌入式智能芯片的算法开发流程,并对以SwinT为例的量化精度提升和部署性能优化做了详细解读,最后分析了如何在征程5上既快又好地部署Transformer模型。3月28日,智东西公开课组织的「自动驾驶新青年讲座」第16讲顺利完结。在这一讲中,地平线工具链核心开发者杨志刚以。本次讲座分为主讲和Q&A两个环节,点击阅读原文可观看完整直播回放。为主题进行了直播讲解。
2023-05-03 15:09:32
1813
原创 (已开源)ECCV 2020 视觉BEV经典算法:LSS详解与代码
本文介绍一篇视觉BEV经典算法:LSS,论文收录于,本文通过显示的进行完成目标语义分割,重点是。
2023-03-06 21:58:43
6412
12
原创 详解视觉BEV3D检测模型: Fast-BEV: A Fast and Strong Bird‘s-Eye View Perception Baseline
本文介绍一篇视觉BEV3D检测模型:,论文收录于。目前大多数现有的BEV感知方案要么需要相当多的资源来执行车端推理,要么性能不高。本文提出了一种简单而有效的框架,称为,它能够在车载芯片上执行更快的BEV感知。为了实现这一目标,本文通过试验发现,其中,(1)和(3)使Fast-BEV能够在车载芯片上快速推理和方便部署,(2),(4)和(5)确保Fast-BEV具有竞争力的性能。这些都使得Fast-BEV成为自动驾驶车载芯片上高性能、快速推理和易于部署的解决方案。
2023-02-05 22:01:02
5996
原创 详解多视角3D检测模型 BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection
论文收录于。在这篇文章中,作者提出了一种新的具有的三维物体检测器。本文提出的BEVDepth通过利用来提高图像深度估计的可信度。作者引入了,以增强深度预测能力。此外,针对不精确特征投影带来的副作用,设计了一种新的。此外借助定制的高效体素池化和多帧机制,BEVDepth在nuScenes测试集上实现了60.9%NDS,NDS得分首次达到60%。
2022-12-30 16:24:03
1720
13
原创 视觉BEV语义分割模型 Simple-BEV: What Really Matters for Multi-Sensor BEV Perception?
本文介绍一篇简单的BEV语义分割模型,这篇文章出彩的是,分析了哪些因素对BEV语义分割影响比较大,此外还分析了如何更好使用Radar数据提高感知性能。
2022-12-18 18:57:29
2947
原创 单目3D物体检测模型(CaDDN): Categorical Depth Distribution Network for Monocular 3D Object Detection
论文收录于。单目3D物体检测的主要挑战在于,由于缺乏直接的距离测量,因此必须根据物体和场景线索来推断物体深度。过去许多方法试图直接估计深度来辅助3D检测,但由于深度预测不准确,性能都比较有限。本文提出了(CaDDN),通过预测每个像素的分类深度分布,将丰富的上下文特征信息投影到3D空间中合适的深度区间。然后,本文使用计算效率高的来产生最终的输出检测。本文将CaDDN设计为一种完全可微的端到端方法,用于。
2022-12-18 11:02:26
1463
转载 2022百度ApolloDay技术开放日:文心大模型在自动驾驶感知中的落地应用
2数据处理大模型技术是自动驾驶行业近年的热议趋势,但能否落地应用、能否用好是关键难题。百度自动驾驶依托文心大模型特色优势,率先实现技术应用突破。百度自动驾驶技术专家王井东表示:文心大模型-图文弱监督预训练模型,背靠文心图文大模型数千种物体识别能力,大幅扩充自动驾驶语义识别数据,如:特殊车辆(消防车、救护车)识别、塑料袋等,自动驾驶长尾问题解决效率指数级提升;此外,得益于文心大模型-自动驾驶感知模型10亿以上参数规模,通过大模型训练小模型,自动驾驶感知泛化能力显著增强。百度认为传感器融合是实现L4自动驾驶的必
2022-12-06 22:29:54
817
转载 自动驾驶之心:毫米波雷达-视觉融合感知方法(前融合/特征级融合/数据级融合)
4D毫米波雷达的兴起未来会促进相机与毫米波雷达的感知能力。之前在两个不同的4D毫米波雷达数据集上进行测试发现,一个数据集中平均每帧4D毫米波雷达会包含330个3D点,一个数据集中平均每帧会返回2700个3D点,点数远远多于传统的3D毫米波雷达,且同时还提供高度信息,无疑会大幅提高二者融合感知能力。
2022-11-13 21:16:32
7686
3
原创 详解4D毫米波雷达数据集(VOD)Multi-class Road User Detection with 3+1D Radar in the View-of-Delft Dataset
论文收录于。下一代毫米波雷达除了提供和外,还会提供信息。
2022-10-18 21:31:42
8787
22
原创 重读经典(CLIP下):《Learning Transferable Visual Models From Natural Language Supervision》
这里使用OpenAI提供的notebook演示CLIP。安装CLIP导入需要的库,PyTorch['RN50','RN101','RN50x4',''''''{'''.sum([int('''.'''('''.'''))'''for'''in'''.'''()]):,}'''下面是图片预处理,即preprocess然后是文本预处理,得到77个tokens") ''''''{}{[]}{[,]:.2f}下面进行zero-shot分类,这里使用CIFAR100{}
2022-10-04 22:38:45
989
原创 重读经典(CLIP上):《Learning Transferable Visual Models From Natural Language Supervision》
CLIP自从去年2月底提出就立马火爆全场,它的方法出奇的简单、但是效果又出奇的好,很多结果和结论都让人瞠目结舌。比如作者说CLIP的迁移学习能力是非常强的,预训练好的这个模型能够在任意一个视觉分类的数据集上取得不错的效果;而且最重要的是它是zero-shot的,意思就是说它完全没有在这些数据集上去做训练,就能得到这么好的效果。论文里做了非常多的实验,在超过30个数据集上去做了测试,涵盖的面非常广,包括了OCR、视频动作检测、还有坐标定位和许多细分类任务。在所有这些结果之中,其中最炸裂的一条就是在。
2022-09-17 10:15:00
1710
转载 地平线:面向规模化量产的智能驾驶系统和软件开发
7月27日,地平线在智东西公开课开设的「地平线自动驾驶技术专场」第3讲顺利完结,地平线智能驾驶应用软件部负责人宋巍围绕》这一主题进行了直播讲解。本次分享主要分为以下4个部分:1、智能驾驶应用软件技术拆解2、软件视角的“软硬结合”与“软硬解耦”3、智能驾驶软件开发平台Horizon TogetherOS Bole™4、智能驾驶应用软件开发趋势展望。...............
2022-08-07 13:21:49
1332
1
原创 详解自动驾驶仿真数据集 SHIFT:A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation
SHIFT:A Synthetic Driving Dataset for Continuous Multi-Task Domain Adaptation本文介绍一个新的自动驾驶仿真数据集:,论文收录于 CVPR2022。是所有自动驾驶系统要面临的挑战。然而,现有的图像和视频驾驶数据集。论文作者介绍了一个。在和、、等方面呈现离散和连续的变化。 数据集包含综合的传感器套件和多种注释,可以在不断增加的域变化水平上,促进的研究。数据集主页:https://www.vis.xyz/shift/......
2022-07-03 11:36:09
2651
1
转载 机器学习编译第2讲:张量程序抽象
02 张量程序抽象 【MLC-机器学习编译中文版】课程主页:https://mlc.ai/summer22-zh/在本章中,我们将讨论对单个单元计算步骤的抽象以及在机器学习编译中对这些抽象的可能的变换。在上一章的概述中,我们介绍到机器学习编译的过程可以被看作。一个典型的机器学习模型的执行包含许多步将输入张量之间转化为最终预测的计算步骤,其中的每一步都被称为。在上面这张图中,。特别的是,许多不同的抽象能够表示(和实现)同样的元张量函数(正如下图所示)。我们可以选择调用已经预先编译的框架库(如 torch.a
2022-07-03 10:24:34
886
1
原创 重读经典:《The Craft of Research(1)》
跟读者建立联系【研究的艺术·一】这一次李沐博士给大家精读的是一本关于论文写作的书籍。这本书总共包含四个大的章节,本期视频李沐博士介绍的是第一个章节:Research,Researchers,and Readers。视频开头,李沐博士介绍到:在学生年代,我的语文和英语基本上徘徊在及格线的边缘,所以在做论文写作的时候一直是不那么自信的,以至于我花了很多时间去学习怎么样做比较好的写作。但后来我发现两件事情:好的写作能给你带来至少两个好处:好消息是说论文写作其实并不难,至少比做研究本身要容易很多。在这期视频和接下
2022-06-25 21:10:02
2948
2
转载 机器学习编译第1讲:机器学习编译概述
MLC-机器学习编译-第一讲-机器学习编译概述课程主页:https://mlc.ai/summer22-zh/机器学习应用程序已经无处不在。我们的智能家居设备由自然语言处理(NLP)和语音识别模型驱动,自动驾驶技术依赖于计算机视觉模型作为支柱,还有推荐系统帮助我们在探索时发现新内容。 同样有趣的是AI应用的部署环境是非常丰富的。推荐系统算法通常由大型公司部署在云平台上;当我们谈论自动驾驶时,我们首先想到的是强大的 GPU 或车辆上的专用计算设备;我们使用手机上的智能应用程序来识别花园中的花朵以及如何照料它
2022-06-20 19:58:57
939
原创 重读经典:《End-to-End Object Detection with Transformers》
DETR 论文精读【论文精读】这一次朱毅博士给大家精读的论文是 ,是目标检测领域里程碑式的一个工作,文章收录于 。 是 的缩写,使用 简化了目标检测流程,不再需要 操作,直接将目标预测看作是。这篇论文在2020年5月第一次挂到 上的时候,就引起了计算机视觉圈的强烈反响,网上很多人都觉得这篇论文应该是 的最佳论文。从20年5月到22年5月两年的时间 的引用呢就已经超过了2000,而且它的官方代码呢也有将近 9000个star。如果跟去年大火的 相比, 的官方代码到现在也只有8000个star,所
2022-06-11 20:40:25
2591
原创 Coursera自动驾驶课程第20讲:Mission Planning in Driving Environments
1. Creating a Road Network Graph2. Dijkstra’s Shortest Path Search3. A-Star Shortest Path Search
2022-06-04 12:12:44
992
4
原创 自动驾驶开源软件和算法库
github:https://github.com/carla-simulator/carladoc:https://carla.readthedocs.io/en/latest/website:http://carla.org/2. Kalman-and-Bayesian-Filters-in-Python (卡尔曼和贝叶斯滤波教材)github:https://github.com/rlabbe/Kalman-and-Bayesian-Fil
2022-05-20 10:42:13
2799
Deep Dive into LLMs like ChatGPT 大纲
2025-02-16
KITTI数据集可视化源码,对应教程为:https://blog.youkuaiyun.com/cg129054036/article/details/119516704
2021-08-08
Coursera无人驾驶课程PPT
2020-12-01
《动手学无人驾驶(1):交通标志识别》训练集和测试集
2019-09-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人