今日CS.CV 计算机视觉论文速览
Wed, 10 Jul 2019
Totally 36 papers
?上期速览✈更多精彩请移步主页
Interesting:
?***通过抽象学习的神经状态机, 研究人员提出了一种融合神经与符号表示优点的视觉识别与推理人员,与神经网络直接操作图像不同,这种方法在冲突想抽取出的隐空间上进行操作和处理,通过同时将视觉和语言模态转移到语义概念的表示上去。针对一副图像,首先预测概率图来表示隐含的语义并作为结构世界模型,随后利用序列推理不断地遍历节点来回答问题或者引出新的推理。(from 斯坦福)
模型视觉目标掩膜:
一些问题的例子:
推理过程的实例:
?SiamMask_E旋转矩形的目标检测方法, 提出了一种利用椭圆拟合的旋转bbox来提高目标跟踪算法的模型。(from 约克大学 CA)
算法流程:
ref:
视觉目标追踪http://www.votchallenge.net/challenges.html
code:https://github.com/STVIR/pysot
?DfSM手持设备上基于微小移动的深度估计, 研究人员基于一种Rank-1分解方法来实现boundle适应,随后利用SVD分解来从相机的移动计算深度值,只需要1/4计算迭代即可,保证了移动设备上的速度和效果。(from 诺基亚)
模型架构:
小运动的几何表示和rank1问题的图像归一化表示:
一些结果:
?三维目标追踪算法, (from RI,CMU)
三维目标追踪算法,与现有算法的对比:
系统架构图:
Daily Computer Vision Papers
Positional Normalization Authors Boyi Li, Felix Wu, Kilian Q. Weinberger, Serge Belongie 用于减少深度神经网络的训练时间的广泛部署的方法是标准化每层的激活。虽然已经提出了各种规范化方案,但它们都遵循共同主题在空间维度上规范化并丢弃提取的统计数据。在本文中,我们提出了一种新颖的归一化方法,明显偏离了这个惯例。我们的方法,我们称之为位置标准化PONO,仅在通道上标准化自然吸引人的维度,其捕获在特定图像位置处提取的特征的第一和第二矩。我们认为这些时刻传达了关于输入图像和提取的特征的结构信息,这为网络可以从特征规范化中受益开辟了新的途径而不是忽视PONO规范化常数,我们建议将它们重新注入后续层以保留或在生成网络中传递结构信息。 |
DSNet: Automatic Dermoscopic Skin Lesion Segmentation Authors Md. Kamrul Hasan, Lavsen Dahal, Prasad N. Samarakoon, Fakrul Islam Tushar, Robert Marti Marly 皮肤病变的自动分割被认为是计算机辅助诊断CAD中黑素瘤诊断的关键步骤。尽管其重要性,皮肤病变分割仍然是一项具有挑战性的任务,因为它们具有多样的颜色,纹理和无法区分的边界,并形成一个开放的问题。通过这项研究,我们提出了一种新的自动语义分割网络,用于健壮的皮肤病变分割,称为Dermoscopic Skin Network DSNet。为了减少使网络轻量化的参数数量,我们使用深度可分离卷积代替标准卷积,以将学习的区分特征投影到编码器的不同阶段的像素空间上。此外,我们实施了U Net和完全卷积网络FCN8,以与提议的DSNet进行比较。我们在两个公开可用的数据集上评估我们提出的模型,即ISIC 2017和PH2。对于ISI 2017和PH2数据集,获得的平均交叉联盟mIoU分别为77.5和87.0,其表现优于ISI 2017挑战赛冠军,相对于mIoU为1.0。我们建议的网络在ISIC 2017数据集上的表现也优于U Net和FCN8,相对于mIoU为3.6和6.8。我们的皮肤病变分割网络优于其他方法,可以在两个不同的测试数据集上提供更好的分段掩模,从而提高黑素瘤检测的性能。我们训练有素的模型以及源代码和预测的面具都是公开的。 |
Deep Learning for Spacecraft Pose Estimation from Photorealistic Rendering Authors Pedro F. Proenca, Yang Gao 在空间交会,对接和碎片移除的轨道上接近操作需要在宽范围的光照条件下和高度纹理化的背景(即地球)下进行精确且稳健的6D姿态估计。本文研究利用深度学习和真实感渲染对已知不合作航天器的单眼姿态进行估计。我们首先提出了一个基于虚幻引擎4的模拟器,名为URSO,用于生成绕地球轨道运行的航天器的标记图像,可用于训练和评估神经网络。其次,我们提出了一种基于方向软分类的姿态估计的深度学习框架,它允许将方向模糊度建模为高斯混合。该框架在URSO数据集和ESA姿势估计挑战中进行了评估。在本次比赛中,我们的最佳模型在综合测试装置上获得第三名,在真实测试装置上获得第二名。此外,我们的结果显示了几个建筑和培训方面的影响,并且我们定性地展示了在URSO数据集上学习的模型如何在空间的真实图像上执行。 |
Gated Multiple Feedback Network for Image Super-Resolution Authors Qilei Li, Zhen Li, Lu Lu, Gwanggil Jeo |