【今日CV 计算机视觉论文速览 第113期】Wed, 8 May 2019

今日CS.CV 计算机视觉论文速览
Wed, 8 May 2019
Totally 44 papers
?上期速览更多精彩请移步主页

在这里插入图片描述

Interesting:

?***MobileNetV3新一代高效的移动端神经网络, 结合互补搜索技术和新型架构谷歌提出了新一代的mobilenet。研究人员利用网络搜索和NetAdapt算法那进行调试,随后利用了新型架构进行了改进。这篇文章主要讲解了如何利用自动化的搜索算法和网络设计改进模型表现。研究人员创造了MobileNetV3-Large和MobileNet-Small模型,并在目标检测和语意分割上进行了应用。在语义分割中提出了了Lite Reduced Atrous Spatial Pyramid Pooling (LR-ASPP) 方法实现了3.2%提升,比v2版本减小了15%。在分割和检测任务中表现更快更好了。(from 谷歌)
新型的V3模块架构:
在这里插入图片描述
高效的最后级:
在这里插入图片描述
新提出的分割方法头:
在这里插入图片描述

模型的精度与速度,模型大小与精度:
在这里插入图片描述在这里插入图片描述

?Oriented Point Sampling,OPS 方向点云采样用于无序点云中的平面检测, 基于稀疏采样并估计法向量,随后生成假设平面,在所有点上最后验证平面。(from Stevens Institute of Technology 斯蒂文斯理工学院)
在这里插入图片描述

?基于几何方法得到鸟瞰图, 通过计算单应性矩阵从而将任意单目视图转化为鸟瞰图。首先利用CNN 来表示点线的几何结构(水平线和消失点四个参数),随后利用合成数据集来进行训练,并在真实数据集撒和功能取得了74.52的AUC。(from VGG 牛津)
鸟瞰图的相机视角:
在这里插入图片描述在这里插入图片描述
流程方法和一些结果:
在这里插入图片描述在这里插入图片描述
dataset:Horizon Lines in the Wild dataset CARLA-VP Dataset CARLA [13]
https://drive.google.com/drive/folders/1o9ydKCnh0oyIMFAw7oNxQohFa0XM4V-g

?基于卫星图像预测乡村人口密度, 精确的人口密度对于政府治理十分重要,但人口普查无法精确覆盖所有的人口。本文基于卫星图像和普查基数提供了一种基于卫星图像的人口密度估计方法。(from 斯坦福 )

印度真实人口密度结果和预测误差:
在这里插入图片描述
数据集:Landsat-8 Sentinel-1
ref: LandScan

?CRF Simulator条件随机场模拟器, 文章提出了一种基于CNN标准架构模拟条件随机场正则化的模拟方法,可以生成数据来训练CRF模拟器,并可集成到CNN架构中,将CRF与CNN的能力进行了结合。(from University of Western Ontario)
在这里插入图片描述
author:http://www.csd.uwo.ca/~olga/
http://www.csd.uwo.ca/~ygorelic/

?Image Matters检测不适宜内容, 提出了一种检测电子商务网站上具有冒犯性或者不宜内容的方法。主要基于网络数据和合成数据将暴力、性暗示和不合时宜的商标logo图像检测出来进行处理。(from 沃尔玛实验室)
数据收集方法视觉检索,以及训练框架:
在这里插入图片描述在这里插入图片描述


Daily Computer Vision Papers

EDVR: Video Restoration with Enhanced Deformable Convolutional Networks
Authors Xintao Wang, Kelvin C.K. Chan, Ke Yu, Chao Dong, Chen Change Loy
视频恢复任务,包括超分辨率,去模糊等,正在计算机视觉界引起越来越多的关注。在NTIRE19挑战赛中发布了名为REDS的具有挑战性的基准。这个新基准从两个方面挑战现有方法1如何在给定大运动的情况下对齐多个帧,以及2如何有效地融合具有不同运动和模糊的不同帧。在这项工作中,我们提出了一种新的视频恢复框架,其具有增强的可变形网络,称为EDVR,以应对这些挑战。首先,为了处理大型运动,我们设计了金字塔,级联和可变形PCD对准模块,其中使用可变形卷积以粗略到精细的方式在特征级别进行帧对齐。其次,我们提出了一种时空空间注意TSA融合模块,其中在时间和空间上都应用注意力,以强调后续恢复的重要特征。得益于这些模块,我们的EDVR赢得了冠军,并且在NTIRE19视频恢复和增强挑战的所有四个轨道中都大幅超越了第二名。 EDVR还展示了对视频超分辨率和去模糊的最新发布方法的卓越性能。代码可在

Context-Aware Automatic Occlusion Removal
Authors Kumara Kahatapitiya, Dumindu Tissera, Ranga Rodrigo
遮挡移除是图像增强的一个有趣应用,为此,现有工作建议手动注释或特定于域的遮挡移除。没有工作尝试将自动遮挡检测和移除作为上下文感知的一般问题来解决。在本文中,我们提出了一种新方法,用于识别与图像上下文无关的对象作为遮挡并将其移除,重建相干占据的空间。所提出的系统通过考虑表示为矢量嵌入的前景和背景对象类之间的关系来检测遮挡,并通过修复来移除它们。我们在COCO Stuff数据集上测试我们的系统并进行用户研究以在上下文感知自动遮挡移除中建立基线。

Learning Unsupervised Multi-View Stereopsis via Robust Photometric Consistency
Authors Tejas Khot, Shubham Agrawal, Shubham Tulsiani, Christoph Mertz, Simon Lucey, Martial Hebert
我们提出了一种基于学习的多视图立体视觉MVS方法。虽然目前深度MVS方法取得了令人瞩目的成果,但它们至关重要地依赖于地面实况3D训练数据,并且获取这种精确的3D几何形状以进行监督是一个主要障碍。我们的框架反而利用多个视图之间的光度一致性作为用于在宽基线MVS设置中学习深度预测的监督信号。然而,由于跨视图的遮挡和光照变化,天真地应用照片一致性约束是不期望的。为了克服这个问题,我们提出了一个强大的损失公式,它强制执行一阶一致性,每个点执行b,有选择地强制与某些视图保持一致,从而隐式处理遮挡。我们展示了使用真实数据集在没有3D监督的情况下学习MVS的能力,并表明我们提出的强大损失的每个组成部分都会带来显着的改进。我们定性地观察到我们的重建通常比获得的基本事实更完整,进一步显示了这种方法的优点。最后,我们的学习模型推广到新颖的设置,我们的方法允许通过无监督的微调,将现有CNN适应数据集,而无需地面实况3D。项目网页

PackNet-SfM: 3D Packing for Self-Supervised Monocular Depth Estimation
Authors Vitor G
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值