- 博客(50)
- 收藏
- 关注
原创 3D稀疏卷积
3D稀疏卷积论文地址:https://arxiv.org/pdf/1711.10275.pdf论文 3D Semantic Segmentation with Submanifold Sparse Convolutional Networks摘要卷积网络是分析图像、视频和三维形状等时空数据的重要基础。虽然其中一些数据自然密集(例如照片),但许多其他数据源本质上是稀疏的。示例包括使用激光雷达扫描仪或RGB-D相机获得的3D点云。卷积网络的标准“密集”实现在应用于此类稀疏数据时效率非常低。我们引入了新的
2022-05-06 20:42:27
2037
原创 稀疏卷积Submanifold Sparse Convolutional Networks
稀疏卷积Submanifold Sparse Convolutional Networks论文 Submanifold Sparse Convolutional Networks论文地址:https://arxiv.org/pdf/1706.01307.pdf本文提出了稀疏卷积,介绍了具体的做法,后续很多三维点云语义分割/目标识别都沿用了这种做法参考:https://blog.youkuaiyun.com/u013066730/article/details/108512125论文的解释https://zhu
2022-05-06 20:40:25
3738
原创 地面车辆三维点云的快速分割Fast segmentation of 3D point clouds for ground vehicles
地面车辆三维点云的快速分割原文 [Fast segmentation of 3D point clouds for ground vehicles]论文地址 :https://ieeexplore.ieee.org/document/5548059/authors#authors代码:https://github.com/lorenwel/linefit_ground_segmentation代码讲解 https://blog.youkuaiyun.com/leesanity/article/details/1
2022-04-29 21:10:49
2015
原创 Semantic Flow for Fast and Accurate Scene Parsing用于快速准确场景解析的语义流
Semantic Flow for Fast and Accurate Scene Parsing用于快速准确场景解析的语义流论文Semantic Flow for Fast and Accurate Scene Parsing代码 https://github.com/lxtGH/SFSegNets论文地址 https://arxiv.org/pdf/2002.10120v3.pdf摘要在本文中,我们专注于设计快速准确的场景解析的有效方法。 提高性能的一种常见做法是获得具有强语义表示的高分辨率
2022-03-25 20:06:00
5188
原创 使用 BEV 投影的高效城市规模点云分割
使用 BEV 投影的高效城市规模点云分割论文 Efficient Urban-scale Point Clouds Segmentation with BEV Projection地址 https://arxiv.org/pdf/2109.09074.pdf代码:https://github.com/zouzhenhong98/SensatUrban-BEV-Seg3D摘要:点云分析近年来吸引了研究人员的眼球,而 3D 语义分割仍然是一个问题。 大多数深度点云模型直接对3D点云进行学习,这将受到城
2022-03-25 20:04:37
5620
原创 PolarNet:在线激光雷达点云语义分割的改进网格表示
PolarNet:在线激光雷达点云语义分割的改进网格表示论文 PolarNet: An Improved Grid Representation forOnline LiDAR Point Clouds Semantic Segmentation代码github:https://github.com/edwardzhou130/PolarSeg论文地址 https://arxiv.org/abs/2003.14032摘要由于自动驾驶系统对细粒度感知的需求,单扫描激光雷达在线语义分割的研究近年来有
2022-03-25 20:02:53
6038
转载 dive into deep learning深度学习计算部分即卷积神经网络部分
dive into deep learning5. 深度学习计算除了庞大的数据集和强大的硬件, 优秀的软件工具在深度学习的快速发展中发挥了不可或缺的作用。 从2007年发布的开创性的Theano库开始, 灵活的开源工具使研究人员能够快速开发模型原型, 避免了我们使用标准组件时的重复工作, 同时仍然保持了我们进行底层修改的能力。 随着时间的推移,深度学习库已经演变成提供越来越粗糙的抽象。 就像半导体设计师从指定晶体管到逻辑电路再到编写代码一样, 神经网络研究人员已经从考虑单个人工神经元的行为转变为从层的角
2022-03-18 20:42:42
1244
原创 STDCnetwork BiSeNet 的实时语义分割的rethinking
(STDCnetwork)Rethinking BiSeNet For Real-time Semantic Segmentation重新思考 BiSeNet 的实时语义分割BiSeNet [28, 27] 已被证明是一种流行的用于实时分割的双流网络。 然而,其添加额外路径来编码空间信息的原理是耗时的,并且由于任务特定设计的不足,从预训练任务(例如图像分类)中借用的主干可能对图像分割效率低下。 为了解决这些问题,我们通过去除结构冗余,提出了一种名为 Short-Term Dense Concatenate
2022-03-18 20:41:13
1273
原创 VoxelNet: 基于点云的 3D 对象检测的端到端学习
VoxelNet: 基于点云的 3D 对象检测的端到端学习论文 :VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection原文地址:https://arxiv.org/abs/1711.06396非官方的复现代码:https://github.com/qianguih/voxelnet摘要准确检测 3D 点云中的对象是许多应用中的核心问题,例如自主导航、家政机器人和增强/虚拟现实。 为了将高度稀疏的 LiDAR
2022-03-04 21:44:19
3420
原创 目前缺少用于语义分割的 3D LiDAR 数据吗?关于三维点云数据集和方法的调查
目前缺少用于语义分割的 3D LiDAR 数据吗?关于三维点云数据集和方法的调查原文Are We Hungry for 3D LiDAR Data for Semantic Segmentation? A Survey of Datasets and Methods论文地址 https://arxiv.org/abs/2006.04307摘要3D 语义分割是机器人和自动驾驶应用的一项基本任务。 最近的工作主要集中在使用深度学习技术上,而开发精细注释的 3D LiDAR 数据集是极其劳动密集型的,并
2022-03-04 21:42:14
1729
原创 ConvLSTM:一种用于降水预报的机器学习方法
ConvLSTM:一种用于降水预报的机器学习方法论文 Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting原文:https://arxiv.org/abs/1506.04214v1论文主要提出了捕捉空间关系的结构 Convolutional LSTM模型基于FC-LSTM(原结构没有考虑空间相关性)摘要降水临近预报的目标是在相对较短的时间内预测局部区域未来的降雨强度。 以前很少有研
2022-02-25 19:48:23
7109
原创 GndNet: Fast Ground Plane Estimation and Point Cloud Segmentation for Autonomous Vehicles
GndNet: Fast Ground Plane Estimation and Point Cloud Segmentation for Autonomous Vehicles作者Anshul Paigwar github https://github.com/anshulpaigwar 里面有一些点云处理的工作主要工作 :地平面估计和地面的分割 在扩充的SemanticKITTI dataset上,是一种端到端的方法,同时在作者的介绍下是可以达到实时的的效果 runtime of 55HZ网络结
2022-02-25 19:47:34
2527
转载 dive into deep learning 循环神经网络 RNN 部分 学习
dive into deep learning 循环神经网络 RNN 部分 学习到目前为止,我们遇到过两种类型的数据:表格数据和图像数据。 对于图像数据,我们设计了专门的卷积神经网络架构来为这类特殊的数据结构建模。 换句话说,如果我们拥有一张图像,我们需要有效地利用其像素位置, 假若我们对图像中的像素位置进行重排,就会对图像中内容的推断造成极大的困难。最重要的是,到目前为止我们默认数据都来自于某种分布, 并且所有样本都是独立同分布的 (independently and identically dist
2022-02-25 19:45:55
1536
原创 Semantic Terrain Classification for Off-Road Autonomous Driving 代码学习 网络结构
Semantic Terrain Classification for Off-Road Autonomous Driving 代码学习 网络结构bevnet网络结构train_funcs = { 'default': train_fixture.train_single,}训练函数nets = { name: spec['net'] for name, spec in ret.items()}net_opts = { name: spec['opt'] for name
2022-02-11 20:10:47
915
原创 Semantic Terrain Classification for Off-Road Autonomous Driving代码学习 数据生成部分
Semantic Terrain Classification for Off-Road Autonomous Driving代码学习github:https://github.com/JHLee0513/semantic_bevnet论文:Semantic Terrain Classification for Off-Road Autonomous Driving数据生成部分generate_bev_gt\kitti_4class_100x100_center_cfg.yaml 这个文件夹下可以更
2022-02-11 20:09:35
1061
4
原创 Semantic Terrain Classification for Off-Road Autonomous Driving代码学习
Semantic Terrain Classification for Off-Road Autonomous Driving代码学习github:https://github.com/JHLee0513/semantic_bevnet论文:Semantic Terrain Classification for Off-Road Autonomous Driving数据生成部分generate_bev_gt\kitti_4class_100x100_center_cfg.yaml 这个文件夹下可以更
2022-01-28 21:10:01
1181
1
原创 基于RGB和LiDAR融合的自动驾驶3D语义分割
基于RGB和LiDAR融合的自动驾驶3D语义分割论文 RGB and LiDAR fusion based 3D Semantic Segmentationfor Autonomous Driving摘要激光雷达已经成为交通驾驶应用的标准传感器,因为他们提供了高度精确的三维点云。激光雷达对于夜间的低光场景或由于阴影而导致相机性能下降的场景也很健壮。激光雷达的感知算法逐渐成熟,包括目标检测和SLAM。然而,语义分割算法的研究相对较少。基于图像语义分割是一种成熟的图像分割算法,本文对基于传感器融合的三维图
2022-01-28 21:08:23
4493
原创 Cylinder3D:一个有效的三维框架用于驾驶场景激光雷达语义分割
Cylinder3D:一个有效的三维框架用于驾驶场景激光雷达语义分割论文 Cylinder3D: An Effective 3D Framework forDriving-scene LiDAR Semantic Segmentation CVPR2021摘要:激光雷达的大规模行车场景语义分割方法经常对二维空间中的点云进行投影和处理。投影方法包括球面投影、鸟瞰图投影等。虽然这个过程使得点云适用于基于cnn的二维网络,但它不可避免地改变和放弃了三维拓扑和几何关系。一种解决3D到2d投影问题的直接方法是保
2022-01-28 21:07:59
5303
原创 面向越野地形自动驾驶的语义地形分类
面向越野地形自动驾驶的语义地形分类论文 Semantic Terrain Classifification for Off-RoadAutonomous Driving代码 https://github.com/JHLee0513/semantic_bevnetCoRL2021据说这个会议上的论文都挺狠的摘要:利用环境信息得到高密度、高精度的可穿越性地图对于越野导航至关重要。在本文中,我们重点研究将地形划分为4个成本等级(free, low-cost, medium-cost, obstacle)
2022-01-21 17:57:17
3114
1
原创 基于深度多模态网络的季节不变语义分割
基于深度多模态网络的季节不变语义分割(略读)原文 Season-Invariant Semantic Segmentation with ADeep Multimodal Network摘要语义场景理解对于越野行驶的自主车辆来说是一种有用的能力。虽然摄像头是用于语义分类的最常见传感器,但当列车和测试装置之间因照明、天气和季节变化而发生显著变化时,使用摄像头图像的方法的性能可能会有所降低。另一方面,来自主动传感器(如激光雷达)的3D信息对这些因素相对不变,这促使我们研究在这种情况下是否可以使用它来提
2022-01-21 17:56:45
1339
原创 城市尺度三维点云的语义分割:数据集、基准和挑战
城市尺度三维点云的语义分割:数据集、基准和挑战(未完))论文 Towards Semantic Segmentation of Urban-Scale 3D Point Clouds: A Dataset, Benchmarks and Challengesgithub https://github.com/QingyongHu/SensatUrban*.*简介在三维场景理解领域中,释放有监督深度学习算法潜力的一个基本先决条件是可以获得大规模且具有丰富注释的数据集。然而,由于数据采集和数据注释成本
2022-01-21 17:56:05
1098
原创 自主驾驶中基于图像和点云融合的:综述
自主驾驶中基于图像和点云融合的:综述(略读)原文 Deep Learning for Image and Point Cloud Fusionin Autonomous Driving: A Review论文地址:https://arxiv.org/abs/2004.05224摘要摘要:在过去的几年中,自动驾驶汽车得到了快速的发展。然而,由于驾驶环境的复杂性和动态性,实现完全自主并非易事。因此,自动驾驶车辆配备了一套不同的传感器,以确保鲁棒、准确的环境感知。特别是,CameralDar融合正在成
2022-01-21 17:50:12
3024
原创 RELLIS-3D数据集
RELLIS-3D数据集(略读)paper RELLIS-3D Dataset: Data, Benchmarks and Analysis论文地址:https://arxiv.org/abs/2011.12954github:https://github.com/unmannedlab/RELLIS-3D论文提供了一个野外场景的数据集,包含有激光雷达数据,摄像头数据摘要语义场景理解对于鲁棒和安全的自主导航至关重要,尤其是在越野环境中。三维语义分割的最新深度学习进展在很大程度上依赖于大型训练数
2022-01-21 17:49:34
3221
原创 LIF-Seg 激光雷达与相机图像融合的三维激光雷达语义分割
LIF-Seg 激光雷达与相机图像融合的三维激光雷达语义分割论文 LIF-Seg: LiDAR and Camera Image Fusion for 3D LiDAR Semantic Segmentation 暂时未发表论文地址:https://arxiv.org/abs/2108.07511摘要:相机和三维激光雷达传感器已经成为现代自动驾驶汽车的重要设备,相机提供了二维空间中细粒度的纹理、颜色信息,而激光雷达捕获了周围环境更精确、更远的距离测量。来自这两个传感器的互补信息使双模态融合成为一种理
2022-01-21 17:48:28
4149
原创 YOdar:基于不确定性的传感器融合,用于带有摄像头和雷达传感器的车辆检测
YOdar:基于不确定性的传感器融合,用于带有摄像头和雷达传感器的车辆检测(略读)论文 YOdar: Uncertainty-based Sensor Fusion for Vehicle Detection with Camera and Radar Sensors摘要论文中,我们提出了一种基于不确定性的传感器与摄像机和雷达数据融合的方法。两个神经网络的输出,一个处理摄像机,另一个处理雷达数据,以不确定性感知的方式组合。为此,我们收集两个网络的输出和相应的元信息。对于每个预测对象,通过梯度增强方法
2022-01-21 17:47:55
1887
原创 paper to do
paper to doRELLIS-3D Dataset: Data, Benchmarks and Analysis√Deep Multi-Modal Object Detection and SemanticSegmentation for Autonomous Driving:Datasets, Methods, and Challenges√Deep Learning for Image and Point Cloud Fusionin Autonomous Driving: A Rev
2022-01-21 17:46:53
530
原创 自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战
自动驾驶深度多模态目标检测和语义分割:数据集、方法和挑战原文地址:https://arxiv.org/pdf/1902.07830.pdfDeep Multi-Modal Object Detection and SemanticSegmentation for Autonomous Driving:Datasets, Methods, and Challenges摘要深度学习推动了自动驾驶感知技术的最新进展。为了实现鲁棒和准确的场景理解,自动驾驶汽车通常配备不同的传感器(如相机、激光雷达、雷达
2022-01-14 19:31:22
8067
2
原创 SAFNet 基于相似性感知的三维语义分割融合网络
SAFNet 基于相似性感知的三维语义分割融合网络论文 Similarity-Aware Fusion Network for 3D Semantic Segmentation IROS 2021全文:https://arxiv.org/pdf/2107.01579.pdf代码github https://github.com/lqzhao/SAFNet摘要论文中,提出了一种相似性感知融合网络 similarity-aware fusionnetwork(SAFNet),通过自适应融合2D图像
2022-01-14 19:30:37
1558
转载 动手学习深度学习 多层感知机部分
原文地址 https://d2l.ai/4.多层感知机在本章中,我们将第一次介绍真正的深度网络。 最简单的深度网络称为多层感知机,它们由多层神经元组成, 每一层与它的上一层相连,从中接收输入; 同时每一层也与它的下一层相连,影响当前层的神经元。 当我们训练大容量模型时,我们面临着过拟合的风险。 因此,本章将从基本的概念介绍开始讲起,包括过拟合、欠拟合和模型选择。 为了解决这些问题,本章将介绍权重衰减和暂退法等正则化技术。 我们还将讨论数值稳定性和参数初始化相关的问题, 这些问题是成功训练深度网络的关键
2022-01-14 19:29:37
879
原创 PointWeb:一种增强点云处理中局部邻域特征提取的方法
PointWeb:一种增强点云处理中局部邻域特征提取的方法相关网站pointweb:Enhancing Local Neighborhood Features for Point Cloud Processing 这是2019年发布在cvpr上的文章论文地址 :http://openaccess.thecvf.com/content_CVPR_2019/papers/Zhao_PointWeb_Enhancing_Local_Neighborhood_Features_for_Point_Cloud_
2022-01-07 21:27:05
4230
转载 Dive into Deep Learning 3.4-3.7节学习
本文为学习《动手学习深度学习》的一些学习,内容来源于网址:https://d2l.ai/ Dive into Deep Learning — Dive into Deep Learning用于学习记录3.3线性回归的简洁实现在本节中,我们将介绍如何通过使用深度学习框架来简洁地实现 3.2节中的线性回归模型。生成数据集同上一节一样,首先我们生成数据集import numpy as npimport torchfrom torch.utils import datafrom d2l impo
2022-01-07 21:26:31
576
原创 RandLA-Net: 大规模点云的高效语义分割(CVPR 2020) 牛津大学
RandLA-Net: 大规模点云的高效语义分割(CVPR 2020) 牛津大学论文:RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds代码:Github相关网站深蓝学院 基于三维点云场景的语义及实例分割 https://www.bilibili.com/video/BV1aE411T7Gf-Introduction to point cloud segmentation-RandLA-Net: Eff
2021-12-31 15:53:02
2435
原创 动手学习深度学习 DIVE into Deep learning 第三章线性神经网络
线性神经网络3.1. 线性回归3.1.1. 线性回归的基本元素线性回归(linear regression)可以追溯到19世纪初, 它在回归的各种标准工具中最简单而且最流行。 线性回归基于几个简单的假设: 首先,假设自变量x和因变量y之间的关系是线性的, 即y可以表示为x中元素的加权和,这里通常允许包含观测值的一些噪声; 其次,我们假设任何噪声都比较正常,如噪声遵循正态分布。在机器学习的术语中,该数据集称为训练数据集(training data set) 或训练集(training set)。 每行
2021-12-31 15:51:14
914
原创 动手学习深度学习 DIVE into Deep learning 的 学习 第一章 前言
动手学习深度学习 DIVE into Deep learning 的 学习 第一章 前言本文为学习《动手学习深度学习》的一些学习,内容来源于网址:https://d2l.ai/ Dive into Deep Learning — Dive into Deep Learning 0.17.1 documentation 主要学习pytorch的一些内容引言全书的结构(https://zh.d2l.ai/_images/book-org.svg)]前言机器学习的任务 生成一个输入到输出的映射具
2021-12-31 15:50:09
1045
原创 roslaunch文件格式解析
roslaunch文件格式解析roslaunch是ros中重要的概念,ros机器人系统是机器人系统就是一堆 node 和 topic (再添加一些 parameter, service 等)构成的网络(rosgraph),其中每个 node 都可以完成一定的功能。使用ros launch可以一次性启动多个node相互关联并设置丰富的参数,是一种较好的结构。roslaunch 可以让所有的节点共享同一个终端。一些网站https://blog.youkuaiyun.com/qq_33444963/article/d
2021-12-24 20:18:35
1150
原创 ipdb python调试工具
ipdb python调试工具在三维点云中,各种矩阵的运算及输出需要多次调试才能够理解和更改,原来一直使用print大法,这样会导致手忙脚乱,而且很烦。现在有一个ipdb工具可以进行方便的调试,同时也不会显得特别蠢。。。。。python 提供了一个默认的 debugger:pdb,而 ipdb 则是 pdb 的增强版,提供了补全、语法高亮等功能,类似于 ipython 与 python 默认的交互终端的关系,通过 pip install ipdb 即可安装 ipdb。github地址 :https:/
2021-12-17 18:09:47
4500
原创 SemanticKITTI数据集:用于激光雷达序列语义场景理解的数据集
SemanticKITTI数据集:用于激光雷达序列语义场景理解的数据集引言在论文文中,作者引入了一个大数据集用于激光的语义分割的研究。标注了KITTI视觉里程计基准的所有数据,并为所使用的汽车激光雷达的完整360度视野提供了密集的逐点注释,基于该数据集,有三个三个基准任务:(i)使用单个扫描对点云进行语义分割,(ii)使用多个过去扫描进行语义分割(iii)语义场景预测同时,作者也提供了baseline介绍introduce语义场景理解对于许多应用程序来说是必不可少的,也是自动驾驶汽车不可或缺
2021-12-17 18:09:15
7798
原创 GNDnet代码学习记录
GNDnet代码学习记录GNDNET 自动驾驶车辆的快速地平面估计和点云分割 这篇文章的主要工作是在pointpillar上进行延伸来进行地面点和非地面的划分。GNGnet数据生成部分主要是在dataset_utils部分gnd_data_generator/semKitti_morph_data.py这个文件是作者魔改了python调用semkitti数据集的api,相当于一个semKitti到python的parser,可以使得semkitti数据集的数据被numpy所使用。同时使用了morp
2021-12-17 18:08:43
772
原创 GNDnet自动驾驶车辆的快速地平面估计和点云分割 实验部分
GNDnet自动驾驶车辆的快速地平面估计和点云分割 实验部分接上一篇损失函数GNDnet的损失函数为回归损失函数和空间平滑损失的加权和其中I表示形状为(H;W)的网格的地面真实高程图,I^表示预测高程图。超参数α和β用于平衡这两种损失。对于高程值的回归,我们使用Huber损失。对于空间平滑度,我们最小化预测高程地图二阶梯度的L1范数。我们对相邻单元的二阶梯度范数进行惩罚,以鼓励高程值不是恒定的,而是平稳变化的:其中其中rx和ry分别是立面图x和y方向上的坡度。具体的训练细节网络结构我们
2021-12-10 20:59:51
852
原创 ubuntu多cuda兼容时切换cuda版本的方法
切换cuda版本查看cuda版本方法1cat /usr/local/cuda/version.txt方法2$ cd /usr/local$ stat cuda 查看指向的哪个版本$ ll /usr/local 查看安装的版本cuda是一个软链接,它指向我们指定的cuda版本(注意上面在设置环境变量时,使用的是cuda,而不是cuda-9.0和cuda-10.0,这主要是为了方便我们切换cuda版本,可以让我们不用每次都去该环境变量的值)切换cuda版本cd /usr/localsud
2021-12-10 20:58:18
899
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人