今日CS.CV 计算机视觉论文速览
Mon, 22 Apr 2019
Totally 38 papers
?上期速览✈更多精彩请移步主页
Interesting:
?Fashion++, 如何通过微小的改变改进时尚程度?研究人员提出了在与学习的编码下合成时尚元素,给出时尚修饰建议。(from UT Austin )
首先通过两个编码器得到了纹理质地和外形的隐含空间编码,随后利用F++对上述特征进行编辑生成t++和s++特征,s++特征将生成二维分割mask,并与修改后的纹理特征t++更新m++得到了新的特征图u++,最后利用Gt生成最终的修改后的时尚着装x++。
其中基于VAE的形状生成:
训练样本生成和编辑的变化:
一些不同因素的影响和结果:
dataset:Chictopia dataset
project: http://vision.cs.utexas.edu/projects/FashionPlus/
?深度神经决策树(NDF)决策过程的可视化, 研究跟踪了决策过程、并对显著性图进行可视化以了解分类和回归问题中最重要的影响因素。(from 香港科技)
code:https://github.com/Nicholasli1995/VisualizingNDF
?Listen to the Image, 通过将视觉转换为声音帮助盲人感知周遭世界。(from OPTIMAL)
模型通过三层感知模型构建声音嵌入、视觉知识学习和交叉模态生成。
ref:http://www.seeingwithsound.com/
?神经网络特征可视化综述, (from 奥本大学 Uber )
?基于特征前传的图像去雾, (from MIT Lincoln Laboratory)
左侧为FastNet模型将特征直接传入金字塔来精炼。右侧为DualFastNet,同时估计了大气光(散射)模型和投射模型。
ref:https://github.com/hezhangsprinter/DCPDN
dataset:2019 NTIRE Image Dehazing Challenge
O-HAZE, I-HAZE, and DenseHaze datasets
?XLSor胸片肺部分割方法,利用了交叉注意力模块,并实现了异常放射数据的生成数据增强。 (from National Institutes of Health Clinical Center US,平安保险)
·
code:https://github.com/rsummers11/CADLab/tree/master/Lung_Segmentation_XLSor
dataset:NIH Chest X-ray dataset
?**视频目标检测与跟踪综述,作为计算机视觉领域的复杂问题,同样需要面临遮挡、变形、运动模糊和尺度变化等影响。分割还需要解决均匀目标、重叠目标、边缘模糊和清晰度复杂性、而追踪则需要处理快速移动、脱离视野和实时处理的要求。video object segmentation and tracking (VOST)将这两个问题结合起来克服了先前方法的困难。这篇文章将综述先进的VOST方法,并对现有方法进行分类,识别出未来的趋势的研究方法。(from 矿大 南洋理工)
现有方法的分类:
基于分割的追踪方法:
?**物体显著性检测Salient Object Detection的综述, 主要侧重于最近5年基于深度学习的SOD方法。(from 人工智能感知研究院阿联酋 香港中文)
SOD的发展历程:
先前SOD领域的综述及侧重点:
近年来基于深度学习方法的模型、架构和数据集:
模型架构的细节:
IIAI:http://www.inceptioniai.org/
github:https://github.com/wenguanwang/SODsurvey
dataset:
1. http://www.wisdom.weizmann.ac.il/∼vision/Seg_Evaluation_DB/dl.html
2. https://ivrlwww.epfl.ch/supplementary_material/RK_CVPR09/
3. http://elderlab.yorku.ca/SOD/
4. https://mmcheng.net/zh/msra10k/
5. http://www.cse.cuhk.edu.hk/leojia/projects/hsaliency
6. http://saliencydetection.net/dut-omron/
7. http://cbi.gatech.edu/salobj/
8. https://i.cs.hku.hk/∼gbli/deep_saliency.html
9. http://saliencydetection.net/duts/
10. http://cs-people.bu.edu/jmzhang/sos.html
11. http://cs-people.bu.edu/jmzhang/sos.html
12. http://www.sysu-hcp.net/instance-level-salient-object-segmentation/
13. http://cvteam.net/projects/CVPR17-ELE/ELE.html
14. http://mmcheng.net/SOCBenchmark/
?ProductNet, 一个高质量的产品表示学习数据集,用于产生多模态的产品嵌入表示、并加速标注过程。(from 亚马逊)
使用的标注工具:
多模态深度学习网络:
谷歌商品分类法:https://www.google.com/basepages/producttype/taxonomy.en-US.txt
?