【今日CV 计算机视觉论文速览 第94期】 4 Apr 2019

今日CS.CV 计算机视觉论文速览
Thu, 4 Apr 2019
Totally 59 papers

在这里插入图片描述

Interesting:

?点云过分割直接到superpoints,研究人员将这一问题转为了如何计算局域几何特征和3D点的射线度量。利用轻量级网络在点云邻域计算出嵌入,并最终以图的方式表示出来。
首先计算每个点的嵌入,随后利用聚类实现过oversegmentation。
在这里插入图片描述
一些例子:
在这里插入图片描述
数据集:室外稠密(S3DIS) 室内稀疏(vKITTI)点云
ref:点云过分割,超体聚类
http://www.cnblogs.com/flyinggod/p/8473871.html

?CRAFT基于单个字符和字符间亲和力的场景文本检测, 与先前基于bbox、语义分割和字符检测的方法不同,这个文章提出了一种使用单个文字的标记和文件的亲和力来实现更好的目标检测。同时提出了一个从合成数据标记文字位置、从真实数据估计文章位置的框架。(from Clova AI Research, NAVER Corp.)
文章提出的标记如下,包含单个文字的标记和文字间的亲和力,利用变换的高斯函数来表示:
在这里插入图片描述
从词级别的标记到字符级别标记的过程:
在这里插入图片描述
网络训练的流程如下图所示:
在这里插入图片描述
训练过程中分数的变化:
在这里插入图片描述
最终通过关键点生成多边形框的过程:
在这里插入图片描述
与一些方法的比较:
在这里插入图片描述
最终的而一些结果:
在这里插入图片描述
数据集:ICDAR2013,ICDAR2015,ICDAR2017,MSRA-TD500,TotalText,CTW-1500

?保边平滑基准数据集,数据集中每张图像包含了7种不同保边平滑算法的14中平滑结果。算法包括:SD filter [6], L0 smoothing [7], Fast Global Smoother (FGS) [8],Tree Filtering [9], Weighted Median Filter (WMF) [10], L1smoothing [12] and Local Laplacian filter (LLF) [11].首先选取每个算法的最优结果,再选取七个算法中的最优结果。
在这里插入图片描述
七种算法的计量和结果:
加权RMSE/MAE
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
一些测评的网络架构:
在这里插入图片描述
一些保边平滑的结果:
在这里插入图片描述在这里插入图片描述

? D 2 D^2 D2-City, 滴滴平台行车记录仪数据集,包含多种路况下10000个视频片段,并为其中1000个片段提供了全帧的12类目标跟踪bbox(from 南加州大学)
在这里插入图片描述在这里插入图片描述

?基于批量统计适应的小数据集(<100)图像生成,通过将预训练生成器进行迁移学习,在小数据集上微调,主要针对生成器隐含层的批量统计信息、尺度和偏移(from 东京大学 &RIKEN)
仅仅基于25个脸部图像的适应效果:
在这里插入图片描述
微调:
在这里插入图片描述

?基于嘴部图像和差分图像的视觉语音识别, (from 帝国理工)
在这里插入图片描述
dataset:OuluVS2(Anina et al., 2015), AVLetters (Matthews et al., 2002),CUAVE (Patterson et al., 2002) and AVLetters2 (Cox et al.,2008).

?基于机器学习和高光谱数据集实现内陆水体叶绿素浓度的估计,基于分光计收集了与叶绿素2浓度对应的水体高光谱数据,并利用机器学习方法估计出叶绿素浓度。 (from Karlsruhe Institute of Technology)
分光计采集数据400 nm to 900 nm,并利用RF\SVM\ANN等机器学习方法来进行建模:
在这里插入图片描述

?昆虫视觉与运动感知review, (from 广州大学)
文章研究了几种模型及其应用:
在这里插入图片描述


Daily Computer Vision Papers

Point Cloud Oversegmentation with Graph-Structured Deep Metric Learning
Authors Loic Landrieu, Mohamed Boussaha
我们提出了一种新的超级学习框架,用于将3D点云划分为超级点。我们将此问题转化为学习局部几何的深嵌入和3D点的辐射测量,使得对象的边界呈现高对比度。使用在点局部邻域上操作的轻量级神经网络来计算嵌入。最后,我们将点云分割制定为关于学习嵌入的图分区问题。

Exploring the Semantics for Visual Relationship Detection
Authors Wentong Liao, Cuiling Lan, Wenjun Zeng, Michael Ying Yang, Bodo Rosenhahn
从图像中检测场景图构建视觉关系旨在给出对象节点及其关系边缘的精确结构描述。对象检测和关系检测的相互促进对于提高其个人表现很重要。在这项工作中,我们提出了一个新的框架,称为语义引导图关系神经网络SGRN,用于有效的视觉关系检测。首先,为了提高物体检测精度,我们引入了源目标类认知变换,该变换将共生对象的特征转换为目标对象域以细化视觉特征。类似地,源目标认知变换用于从关系的特征细化对象的特征,反之亦然。其次,为了提高关系检测的准确性,除了配对对象的视觉特征外,我们还分别嵌入了对象和主语的类概率,以提供高级语义信息。另外,为了减少关系的搜索空间,我们设计了一个语义感知关系过滤器来排除那些没有关系的对象。我们评估我们在Visual Genome数据集上的方法,它实现了视觉关系检测的最先进性能。此外,我们的方法还显着改善了物体检测性能,即mAP精度为4.2。

FatSegNet : A Fully Automated Deep Learning Pipeline for Adipose Tissue Segmentation on Abdominal Dixon MRI
Authors Santiago Estrada, Ran Lu, Sailesh Conjeti, Ximena Orozco Ruiz, Joana Panos Willuhn, Monique M.B Breteler, Martin Reuter
目的开发一种快速,全自动的深度学习管道FatSegNet,用于准确识别,分割和量化来自莱茵兰的Dixon MRI上的腹部脂肪组织研究一项基于人口的大型研究。方法FatSegNet由三个阶段组成:使用两个2D竞争密集完全卷积网络CDFNet对腹部区域进行一致定位,ii通过独立CDFNets在三个视图上分割脂肪组织,以及iii视图聚合。 FatSegNet使用33个手动注释的受试者进行训练,并通过1个比较分割准确性与覆盖范围广泛的体重指数BMI,2个测试再测试可靠性和3个健壮性的测试集进行验证。结果与传统的深度学习网络相比,CDFNet表现出更强的稳健性。 FatSegNet骰子评分优于腹部内脏脂肪组织VAT的手动评分,0.828对0.788,并且在皮下脂肪组织SAT上产生可比较的结果,0.973对0.982。该管道具有非常小的测试再测试绝对百分比差异和扫描会话之间的良好协议VAT APD 2.957,ICC 0.998和SAT APD 3.254,ICC 0.996。结论FatSegNet可以在1分钟内可靠地分析3D Dixon MRI。它广泛适用于不同的体形,在大型队列研究中敏感地复制已知的VAT和SAT体积效应,并允许对脂肪隔室进行局部分析。

Learning for Multi-Type Subspace Clustering
Authors Xun Xu, Loong Fah Cheong, Zhuwen Li
从假设和测试,代数和基于谱聚类的角度对子空间聚类进行了广泛的研究。大多数人假设只存在单个类型的子空间。对多种类型的推广是非常重要的,受到诸如模型类型和数量的选择,采样不平衡和参数调整等挑战的困扰。在这项工作中,我们将多类型子空间聚类问题表达为通过深层多层感知器mlps学习非线性子空间滤波器之一。对所学习的子空间滤波器的响应用作聚类友好的特征嵌入,即,相同聚类的点将通过网络更紧密地嵌入在一起。对于推理,我们将K均值应用于网络输出以对数据进行聚类。在合成和现实世界多类型拟合问题上进行实验,产生最先进的结果。

A Visual Neural Network for Robust Collision Perception in Vehicle Driving Scenarios
Authors Qinbing Fu, Nicola Bellotto, Huatian Wang, F. Claire Rind, Hongxin Wang, Shigang Yue
该研究解决了非常复杂和动态的真实物理场景中视觉碰撞检测的挑战性问题,特别是车辆驾驶场景。这项研究的灵感来自一个大型隐约敏感神经元,即蝗虫视觉通路中的小叶巨型运动探测器LGMD,它代表快速接近物体的高尖峰频率。基于我们以前的模型,在本文中,我们提出了一种新的抑制机制,能够适应不同水平的背景复
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值