今日CS.CV 计算机视觉论文速览
Wed, 24 Apr 2019
Totally 43 papers
?上期速览✈更多精彩请移步主页
Interesting:
?从学习到大师的知识融合, 联合场景解析、深度估计的新方法。创造一个可以无需人类标注,从两个预训练模型中自主学习的方法。通过将预训练模型的特征映射到学生模型,实现了可以同时训练学习多个任务的方法。首先初始化与教师网络相同的目标网络,随后训练目标网络的每一个block,并决定分支网络的位置,最后将教师网络的分支拿过来使用,并移除初始网络。精调最终的目标网络。可以理解为训练了一个满足两个任务的嵌入隐变量(通用编码器),并基于这个隐变量利用原始网络的解码器实现功能。(from 浙大)
可以结合两种网络模型功能,获取新功能的模型,实现知识融合:
知识融合模块:
?RSD:Regression Surface Descriptor回归表面描述子,一种基于边缘检测的参数化表面模型。首先将图像看做是参数化表面,随后利用局域参数化模型来表示图像内容,最后利用对表面不连续敏感的参数模型来实现有效的边缘检测,具有对模糊的鲁棒性和定制化的灵活性。 (from Troyes University of Technology)
提出参数化模型:
不同配置下的结果:
此方法的鲁棒性:
?Water-Filling, 用于文件拍摄时表面阴影的去除,解决了拍摄文件时灯光造成的阴影。首先利用像素值形态学的方法估计了阴影部分,随后利用浸入过程找出阴影区域,利用新的扩散方程的迭代来实现模拟。最后基于朗伯表面模型来重建了文件表面。(from KAIST )
估计阴影区域:
漫水扩散方法找到阴影区域:
重建结果:、
?2D3D-MatchNet, 二维图像和三维点云的关键点匹配。(from 新加坡国立)
?DeepCaps, 基于三维卷积的动力学路由算法。(from University of Moratuwa)
三维卷积的动态路由:
基于DeepCap模块的卷积网络:
project:https://github.com/brjathu/deepcaps
?CRESI, 直接从卫星影响中抽取道路。(from )
标注和图像处理过程:
道路抽取的过程:
?ORDSR, 通过正交正则化深度网络实现的自适应域迁移的图像超分辨(from 宾夕法尼亚大学)
?大规模半监督单目深度估计的RGB-D数据集, 基于学生-老师的半监督训练机制在大规模的非标注数据上取得了很好的效果。(from 延世大学)
数据集和一些结果:
project:https://dimlrgbd.github.io
?RERERE, 真实室内的远程嵌入推理表达,视觉语言导航。(from 阿德莱德大学)
ref:Vision-and-language navigation: Interpreting visuallygrounded navigation instructions in real environments CVPR2018
?芬兰二战摄影师照片分析, (from 芬兰坦佩雷大学)
二战照片数据集:http://www.loc.gov/pictures/collection/fsa/
Daily Computer Vision Papers
DenseNet Models for Tiny ImageNet Classification Authors Zoheb Abai, Nishad Rajmalwar 在本文中,我们在Tiny ImageNet数据集上提出了两种图像分类模型。我们基于密集连接卷积网络的思想,从头开始构建了两个截然不同的网络。网络的体系结构基于该特定数据集的图像分辨率并通过计算卷积层的感知域来设计。我们还使用了一些与图像增强和循环学习率相关的非传统技术来提高模型的准确性。网络在高约束和低计算资源下训练。我们的目标是实现结果的前1个验证准确度,并且还提供了错误分析。 |
Interpretable and Generalizable Deep Image Matching with Adaptive Convolutions Authors Shengcai Liao, Ling Shao 对于图像匹配任务,如人脸识别和人物识别,现有的深度网络通常关注表示学习。然而,在没有域适应或转移学习的情况下,学习模型是固定的,其不适于处理各种看不见的场景。在本文中,除了表示学习之外,我们还考虑如何在深度特征映射中直接形成图像匹配。我们将图像匹配视为在特征映射中寻找局部对应关系,并在运行中构建自适应卷积核以实现局部匹配。通过这种方式,匹配过程和结果是可解释的,并且这种显式匹配比表示特征更加普遍,以便看不见的场景,例如未知的未对准,姿势或视点变化。为了促进这种图像匹配架构的端到端训练,我们进一步构建了一个类存储器模块,用于缓存每个类的最新样本的特征映射,以便计算用于度量学习的图像匹配损失。该方法初步验证了人员识别任务。通过直接交叉数据集评估而无需进一步的转移学习,它实现了比许多转移学习方法更好的结果。此外,提出了一种基于模型自由时间共生的得分加权方法,该方法进一步提高了性能,从而在交叉数据集评估中得到了最新的结果。 |
BIT: Biologically Inspired Tracker Authors Bolun Cai, Xiangmin Xu, Xiaofen Xing, Kui Jia, Jie Miao, Dacheng Tao 由于各种因 |