【今日CV 计算机视觉论文速览 第147期】Tue, 23 Jul 2019

今日CS.CV 计算机视觉论文速览
Tue, 23 Jul 2019
Totally 52 papers
?上期速览更多精彩请移步主页

在这里插入图片描述

Interesting:

?基于图像迁移的夜间车辆检测, 提出了一种利用白天的标记数据训练夜晚无标记数据的目标检测方法,基于生成对抗网络来生成黑夜图像的标记,随后利用GAN生成的图像来训练模型进行夜间检测。(from Universidade Federal do Esp´ırito Santo)
在这里插入图片描述
基于cycleGAN的图像迁移模型:
在这里插入图片描述
一些迁移后的样本和效果:
在这里插入图片描述

?基于RGB-D的目标检测综述参考书, 针对传统方法和深度学习方法进行了综述(from 西澳大利亚大学)
在这里插入图片描述
author:http://isaacronaldward.com/

?基于深度学习目标检测综述, 分析了现有的典型检测方法和数据集,提供了针对各种方法系统同的测评,列出了各种应用场景。给出了一些开放问题和未来的发展方向。(from 西安交大)
在这里插入图片描述
典型应用包括安防、军事、交通、医学、家居,还包括弱监督检测、显著性检测、强调检测、边缘检测、文本检测、多域的通用能力和视频目标检测、3D位姿检测等等。未来趋势将在视频、后处理法、弱监督、多领域、3D、显著性、无监督、多任务、多传感器、移动终端、医学生物、遥感和实时检测以及GAN相关的应用中发展。

?MegaDepth单视图深度重建, 包含了一个深度数据集MegaDepth,可用于深度预测、深度图修复等。同时提出了基于图像的深度估计网络。(from 康奈尔大学)

文章中几种损失函数值得学习,包括L1,梯度匹配损失以及顺序ordinal损失
在这里插入图片描述在这里插入图片描述
website:http://www.cs.cornell.edu/projects/megadepth/

?视网膜启发的针对动态视觉传感器采样方法用于视觉纹理重建, (from 北大)
在这里插入图片描述


Daily Computer Vision Papers

Automatic detection of multiple pathologies in fundus photographs using spin-off learning
Authors Gwenol Quellec, Mathieu Lamard, Pierre Henri Conze, Pascale Massin, B atrice Cochener
在过去的几十年中,在糖尿病视网膜病变DR筛查网络中收集了大量的眼底照片数据集。通过深度学习,这些数据集被用于训练DR的自动检测器和一些其他常见病理,目的是自动筛查。迄今为止,一个挑战限制了这种系统的采用,自动检测器忽略了眼科医生目前检测到的罕见病症。为了解决这个限制,我们提出了一种新的机器学习ML框架,称为旋转学习,用于自动检测稀有条件。该框架扩展了针对频繁条件训练的卷积神经网络CNN,其具有用于罕见状况检测的无监督概率模型。旋转学习是基于以下观察:CNN经常感知包含相同异常的照片,即使这些CNN被训练以检测不相关的条件。这个观察是基于t SNE可视化工具,我们决定将其包含在我们的概率模型中。离散学习支持热图生成,因此可以在图像中突出显示检测到的异常以供决策支持。在来自OPHDIAT筛选网络的160,000多次筛选检查的数据集中的实验表明,脱离学习可以检测出41个中的37个条件,其中ROC曲线下面积AUC大于0.8平均AUC 0.938。特别是,离散学习明显优于其他候选ML框架,用于检测罕见条件多任务学习,转移学习和一次性学习。我们希望这些更丰富的预测能够引发自动眼病理筛查,这将彻底改变眼科临床实践。

Multi-Class Lane Semantic Segmentation using Efficient Convolutional Networks
Authors Shao Yuan Lo, Hsueh Ming Hang, Sheng Wei Chan, Jing Jhih Lin
车道检测在自驾车中起着重要作用。一些研究利用语义分割网络来提取稳健的泳道特征,但很少有人能够区分不同类型的泳道。在本文中,我们关注多类车道语义分割的问题。基于观察到车道是道路场景图像中的小尺寸和窄宽度物体,我们提出了两种技术,特征尺寸选择FSS和减压膨胀块DD块。 FSS允许网络使用适当的特征尺寸提取薄道特征。为了获得细粒度的空间信息,DD Block由一系列扩张的卷积构成,具有递减的扩张率。实验结果表明,与基线系统相比,所提出的技术在准确性方面提供了明显的改进,同时它们实现了相同或更快的推理速度,并且可以在高分辨率图像上实时运行。

k-t NEXT: Dynamic MR Image Reconstruction Exploiting Spatio-temporal Correlations
Authors Chen Qin, Jo Schlemper, Jinming Duan, Gavin Seegoolam, Anthony Price, Joseph Hajnal, Daniel Rueckert
动态磁共振成像MRI在k空间和时间上表现出高度相关性。为了加速动态磁共振成像并利用来自高度欠采样数据的k t相关,我们在此提出一种新的基于深度学习的动态MR图像重建方法,称为k t NEXT k t NEtwork with X f Transform。特别是,受k t BLAST和k t FOCUSS等传统方法的启发,我们建议从x f域中的混叠信号重建真实信号,以利用时空冗余。在此基础上,所提出的方法然后通过以迭代方式交替x f空间和图像空间之间的重建过程来学习恢复信号。这使得网络能够有效地捕获有用信息并共同利用来自两个互补域的时空相关性。在高度欠采样的短轴心脏电影MRI扫描上进行的实验表明,我们提出的方法在数量和质量上都优于现有技术的动态MR重建方法。

++卫星地表覆盖分类Satellite-Net: Automatic Extraction of Land Cover Indicators from Satellite Imagery by Deep Learning
Authors Eleonora Bernasconi, Francesco Pugliese, Diego Zardetto, Monica Scannapieco
在本文中,我们通过深度学习DL解决了卫星图像土地覆盖分类的挑战。土地覆盖旨在探测领土的物理特征,并估算某类实体植被,住宅建筑,工业区,森林区,河流,湖泊等占用土地的百分比.DL是大数据分析的新范例特别是对于计算机视觉。由于高度自动化和计算性能,DL在土地覆盖目的图像分类中的应用具有很大的潜力。特别地,卷积神经网络CNN的发明是该领域的进步的基础。 1,联合国全球工作组的卫星任务组介绍了迄今为止在官方统计中使用地球观测所取得的成果。然而,在该研究中,尚未探索CNN用于图像的自动分类。这项工作调查了CNN用于估算土地覆盖指标的用途,提供了第一个有希望的结果的证据。特别是,该论文提出了一种称为卫星网的定制模型,能够在测试集上达到高达98的精度水平。

A Survey of Deep Learning-based Object Detection
Authors Licheng Jiao, Fan Zhang, Fang Liu, Shuyuan Yang, Lingling Li, Zhixi Feng, Rong Qu
对象检测是计算机视觉中最重要,最具挑战性的分支之一,它已被广泛应用于人们的生活中,如监视安全性,自动驾驶等,目的是定位某类语义对象的实例。随着用于检测任务的深度学习网络的快速发展,对象检测器的性能得到了极大的提高。为了更深入地了解目标检测管道的主要发展现状,本次调查首先分析了现有典型检测模型的方法,并对基准数据集进行了描述。之后,我们主要以系统的方式全面概述各种物体检测方法,包括一级和两级探测器。此外,我们列出了传统和新的应用程序。还分析了一些代表性的物体检测分支。最后,我们讨论利用这些目标检测方法构建一个有效和高效的系统的架构,并指出一套发展趋势,以更好地遵循最先进的算法和进一步的研究。

+古文献图像检索Deep Learning Approaches for Image Retrieval and Pattern Spotting in Ancient Documents
Authors Kelly Lais Wiggers, Alceu de Souza Britto Junior, Alessandro Lameiras Koerich, Laurent Heutte, Luiz Eduardo Soares de Oliveira
本文介绍了使用深度学习在文档图像中进行基于内容的图像检索和模式定位的两种方法。第一种方法使用预先训练的CNN模型来应对训练数据的缺乏,训练数据经过精细调整以实现查询和候选图像的紧凑但有区别的表示。第二种方法使用在ImageNet数据集的先前准备的图像对子集上训练的Siamese卷积神经网络,以提供基于相似性的特征图。在这两种方法中,学习的表示方案考虑了不同大小的特征图,这些特征图根据检索性能进行评估。使用两个公共数据集Tobacoo 800和DocExplore的强大实验方案已经表明,所提出的方法与现有技术文档图像检索和模式定位方法相比是有利的。

Markerless Augmented Advertising for Sports Videos
Authors Hallee E. Wong, Osman Akar, Emmanuel Antonio Cuevas, Iuliana Tabian, Divyaa Ravichandran, Iris Fu, Cambron Carter
无标记增强现实可以是具有挑战性的计算机视觉任务,尤其是在直播设置中以及缺少与视频捕获相关的信息(例如固有的相机参数)。这通常需要熟练的艺术家的帮助,以及在后期制作环境中使用高级视频编辑工具。我们提出了一种自动视频增强管道,用于识别感兴趣的纹理并将广告叠加到这些区域上。我们限制广告以美观和自然的方式
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值