今日CS.CV 计算机视觉论文速览
Tue, 21 May 2019
Totally 57 papers
?上期速览✈更多精彩请移步主页
Interesting:
?学习人像透视畸变消除问题, 提出了一种能够消除近距离人像摄影畸变的方法,通过预测每个像素需要移动的纠正流图来避免了对于3D人脸建模的过程,同时还补充了透视变换中确实的细节,可广泛应用于人脸重建、三维重建、消除相机畸变,并建立了透视变化数据集。(from 南加州大学 Pinscreen)
方案的流程图,其中包含三个步骤,相机参数估计用于得到校正流,随后得到仿射变化后图像并补全,最后融合合成去畸变人脸。
模型如下:
不同焦距下的人脸和去畸变的效果:
?SAWNet部分注意力的3D点云处理, 引入了可以结合全局与局域信息的网络层嵌入,并利用残差连接提高层间信息的传递。(from 约克大学)
网络结构及SAW层间的传递:
分类和分割方法的比较结果:
?快速规则约束的平面重建RCPR, 基于曼哈顿平面约束提出了快速高效的平面重建算法,利用隐含角度约束代替了原始的角度约束,引入了参数限制不同法向量的个数,提出了方向限制模型DC。(from 集美大学厦门大学)
一些平面重建的结果:
不同方法的比较:
dataset:UZH IfI (12 data), UZH Irchel (10 data), ETH (18 data), Rooms detection datasets (9 data), and Full 3D (8 data).
https://www.ifi.uzh.ch/en/vmml/research/datasets.html
?DeepInspect, 模型对某些类别有混淆和偏见造成了分类器的错误和不稳定。现有的DNN方法主要在于验证每张图像的缺失了对于group级别的评测。研究人员设计了DeepInspect来进行白盒测试,检测模型的混淆和偏见(from 哥伦比亚大学)
code:https://deeplearninginspect.github.io/DeepInspect/
?单图像构建建筑物外框线, 同时检测显著性点和外框线,并预测消失点的深度,这种方法更为简单和通用,最后生成向量表示的紧致3D线框模型可用于AR与CAD中(from 伯克利 adobe)
一些最终的检测结果:
基于SceneCity合成数据,并基于MegaDepth真实数据
ref:https://github.com/Microsoft/MixedRealityToolkit-Unity
video:https://www.youtube.com/watch?v=l3sUtddPJPY
?Parts4Feature从多视角下的部分信息学习三维全局特征, 研究人员提出了一种描述三维外形部分结构的检测基准,关键在于将语义部件的检测能力迁移到了多视角下三维特征的学习中去。(from 清华)
模型由区域部分检测分支和全局特征学习分支构成,共享区域推举模块。
全局特征分支衔接了多个检测到的部分特征并利用多注意力机制实现学习。区域推选使得全局与局部信息得以区分。提出部分分割标注通用语义部分Generally semantic parts(GSP)。
Dataset: ShapeNetCore,Labeled-PSB, and COSEGModelNet10.
ref:
Mesh-based deep learning models
Voxel-based deep learning models.
Deep learning models for point clouds.
View-based deep learning models.
?PFOD基于正例聚焦的目标检测器, 在目标检测前使用正例聚焦忽视负例渐进传播不完整标签,随后再应用通用目标检测算法。这种策略将mAP实现了大幅提升。(from 微软)
小标签的数据集:
dataset: CARPK Drink35,self-made
政府的大规模免费数据源
?ChineseFoodNet,大规模中餐食物识别数据集 (from Midea Emerging Technology Center)
dataset:https://sites.google.com/view/chinesefoodnet/
?****AutoDispNet:基于自动机器学习改善视差估计,将自动机器学习拓展到了大规模的U-Net编码器解码器架构上,基于贝叶斯参数优化器和神经架构搜索得到了改善视差图的效果,同时还不需要大规模的计算集群。 (from 德国弗莱堡大学)
待搜索的模块:
稠密视差搜索模块和自动得到的网络模型:
学习到的结构:
得到的一个结果:
视差数据集:FlyingThings3D
, https://lmb.informatik.uni-freiburg.de/resources/
3D creation suite Blender
ref:立体匹配网络:https://github.com/JiaRenChang/PSMNet
Disparity, Optical Flow, and Scene Flow Estimation
Practical Deep Stereo
?基于视差的图像HDR, 从多张视图中得到HDR,利用启发式的方法实现图像高动态范围。(from University of Reims Champagne-Ardenne )
conference:DISP 2019 disp-conference.org - Home,The International Conference on Digital Image & Signal Processing
dataset:http://vision.middlebury.edu/stereo/data/
?消除大气扰动对成像造成的影响, 研究人员通过分析了参考帧的生成和盲卷积步骤,通过使用大误差利用中的工具严格证明了需要回复可靠图像的最少帧数。讨论了位置扰动模型的潜在缺陷和空时非局域权重评价方法生成参考。最后利用数据驱动的方法实现盲卷积,基于点扩散函数的分布。(from 普渡)
文末有推导,附录
?基于人脸关键点检测老年人痴呆, (from Georgian Partners Inc )
Methods (and models) were used in ouranalysis: Active Appearance Models (AAM) [11], ConstrainedLocal Neural Field (CLNF) [5], Coarse-to-FineShape Searching (CFSS) [35], Face Alignment Network(FAN) [8], Mnemonic Descent Method (MDM) [32], andPosition Map Regression Network (PRNet) [14].
Six datasets: Helen [23], AFW [28], LFPW [7],MENPO Profile [34], UNBC-McMaster Pain Archive [25],and Pain Dataset for Dementia [16].
?slam算法基准的特点, (from 佐治亚理工)
典型数据集序列:
code:https://github.com/ivalab/Benchmarking_SLAM
?无人机阴影检测, (from 洛桑理工)
site:https://github.com/IVRL/Drone-Shadow-Tracking
?REPLAB用于机器人学习的低成本基准评测, (from 伯克利)