
深度学习
文章平均质量分 92
小玺玺
研究领域:机器学习,深度学习,计算机视觉
展开
-
论文阅读 2021 —— Pixel-Perfect Structure-from-Motion with Featuremetric Refinement
三维重建的基础就是在多个视图中寻找属于同一个三维点对应的二维图像坐标,也就是关键点。经典算法是一次性检测所有关键点,对于误差较大的特征,会影响最终重建的结果。作者通过直接对齐来自多个视图的低级图像信息,refine SfM的两个关键步骤:在进行几何估计之前,首先调整初始关键点位置。随后优化点和相机pose作为后处理。这种改进对大的检测噪声和外观变化具有鲁棒性,因为它优化了基于神经网络预测的密集特征的特征度量误差。这显著提高了各种关键点检测器算法、具有挑战性的观察条件和现成深度特征的相机pose和场景几何体的原创 2021-09-06 10:34:44 · 2849 阅读 · 7 评论 -
论文阅读2021——Motion Basis Learning for Unsupervised Deep Homography Estimation with Subspace Projection
2 算法2.1 网络结构网络结构如下所示,输入两个图片Ia,IbI_a,I_bIa,Ib,经过特征提取和单应估计网络,输出8个参数,这8个参数不是单应矩阵的8个参数,输出的这8个参数与8个预计算好的单应流加权平均才是最后的结果。单应流和它的基本形式。单应矩阵有8个自由度,可以利用4对对应点直接通过直接馅饼变换计算得到。...原创 2021-08-26 17:42:02 · 1056 阅读 · 0 评论 -
论文阅读 2020 —— VDO-SLAM: A Visual Dynamic Object-aware SLAM System
2 方法2.1 背景和符号下面给出一些符号的定义,配着图看可能更容易理解。0Xk,0Lk^0X_k,^0L_k0Xk,0Lk表示本体到全局坐标系的变换矩阵,分别代表相机和目标3D的位姿。kkk表示第几帧数据。0mki=[mxi,myi,mzi,1]T^0m_k^i=[m^i_x,m^i_y, m^i_z,1]^T0mki=[mxi,myi,mzi,1]T表示第k时刻,第i个点在全局坐标系下的齐次坐标,那么这个点在相机坐标系下的表示就为Xkmki=0Xk−10mki^{X_k}m^i_k原创 2021-08-25 16:47:06 · 791 阅读 · 0 评论 -
论文阅读 2018 —— CodeSLAM - Learning a Compact, Optimisable Representation for Dense Visual SLAM
阅读一篇论文,学习一个稠密的可优化的用于稠密视觉SLAM的表达。在3D感知系统中,几何表达仍然是一个关键研究课题。稠密的map能够捕获完整的曲面形状,而且能够用语义标签增强,但是它们的高纬度特性使得存储和计算变得非常庞大,而且不适合严格的概率推理。基于稀疏特征的表达能够避免这些问题,但是只能采集部分场景信息,而且仅仅主要用来定位。作者提出了一个稠密(compact but dense)的场景几何表达,输入一个强度图。方法适用于一个基于关键帧单目稠密SLAM系统。尽管每个带有code的关键帧能够产生一个密原创 2021-08-17 16:48:57 · 810 阅读 · 1 评论 -
论文阅读 2021 —— DnD: Dense Depth Estimation in Crowded Dynamic Indoor Scenes
论文阅读,在拥挤的动态室内场景下的稠密深度预测。作者提出了一个方法来估计深度,相机在复杂且拥挤的室内环境中移动,比如一个百货商店 或一个地铁站。通过在一个动态场景中训练,算法能够预测整个场景中绝对尺度的深度信息,包括一个静态的背景和多个移动人群。因为从拥挤的室内环境中采集稠密深度图是困难的,因此作者设计了一个训练框架,这个框架不需要从深度传感器采集到的深度信息。作者提出的网络使用了RGB图像和由传统3D重建方法得到的稀疏深度。不显著跟踪非刚性移动的人群,作者使用了两个约束来处理深度。在包含复杂且拥挤场景数原创 2021-08-17 13:42:27 · 575 阅读 · 0 评论 -
论文阅读 2021 —— CodeMapping: Real-Time Dense Mapping for Sparse SLAM using Compact Scene
我读啥了自己看标题(今天头疼的厉害,呜呜呜/(ㄒoㄒ)/~~)1 介绍之前研究标定SLAM精度的关键是信息点的选择(典型地,角点或边缘点)和相机Pose与地标位置的联合优化。与将地图构建和相机姿态估计分离的密集方法相比,稀疏 SLAM 产生更准确的结果。在实际应用中,稀疏 SLAM 通常与其他传感器融合以提高鲁棒性。然而,稀疏特征图没有视觉信息,不能直接用于无碰撞运动规划或表面感知 AR 等任务。许多方法都尝试同时实现密度映射(dense mapping)和相机自主定位,但是不如稀疏方法效果好,有两点原原创 2021-08-13 18:48:32 · 1284 阅读 · 1 评论 -
论文阅读 2021——SUNet: Symmetric Undistortion Network for Rolling Shutter Correction
今天看一篇论文《SUNet: Symmetric Undistortion Network for Rolling Shutter Correction》用于卷帘快门的对称不失真网络SUNet。现在的消费级相机采用的卷帘快门机制,当相机快速移动的时候,采集到的图像是有扭曲的。这个论文就提出了一个网络使用一对连续帧解决这个问题。网络用于预测这两帧中间时刻的图像。这个对别的现有方法是比较困难的,因为这些算法需要两个姿态差异比较大的图像。1 介绍2 方法方法输入两张连续的图像,最后输出一个在两个图像中间时原创 2021-08-12 15:19:03 · 1612 阅读 · 0 评论 -
论文阅读 2021 —— DRO: Deep Recurrent Optimizer for Structure-from-Motion
阅读一个关于预测深度图和相机姿态的一篇论文《DRO: Deep Recurrent Optimizer for Structure-from-Motion》用于SFM的深度循环优化器。通过机器学习的方法研究SFM问题越来越多了,早期的风法是直接从图像中得到一个深度图和相机姿态,现在出现很多通过在网络中嵌入优化器用多视角提高精度。这个论文展示了一个基于循环网络的优化方法来进一步探索SFM网络中的潜力。优化器通过迭代来最小化feature-metric cost来更新深度和相机位姿。该方法作为一个零次优化器,原创 2021-08-10 14:30:37 · 1014 阅读 · 2 评论 -
Jetson TX2 手动安装cuda opencv cudnn等文件与Jetpack 4.2、4.4下载地址
最近使用其他载板刷TX2系统,Jetpack 4.2, 刷完系统,安装必须库时候,usb始终无法链接到TX2上,就是停在了输入TX2 username password上了,所以我把下载的文件考出来,单独进行安装。安装时候并非一个个安装即可使用,涉及到许多依赖项相关,因此,我提供了相关的安装顺序。这里我没安装visionworks和Tegra_Multimedia这类扩展库,之前测试过,在640...原创 2019-09-13 14:54:16 · 6804 阅读 · 41 评论 -
论文阅读 2017-Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade
最近在读一篇2017的CVPR的论文,Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentationvia Deep Layer Cascade,并非所有像素都是相等的:通过深层级联实现困难感知的语义分割。下面从论文进行细致的分析。文章目录摘要深的层级联摘要我们提出了一个深层级联(Layer cascade, LC)的方法来...原创 2019-02-14 23:25:37 · 1365 阅读 · 5 评论