【AI视野·今日CV 计算机视觉论文速览 第161期】Thu, 26 Sep 2019

本文综述了计算机视觉领域的最新研究,涵盖了高效图像超分辨、深度学习合成数据、胎儿MRI运动跟踪、病理学图像分析、深度伪造检测、多模式图像合成等主题。介绍了多种创新算法和技术,如基于深度学习的胎儿运动跟踪、域适应性病理图像分割、多流生成对抗网络等,展示了深度学习在解决复杂视觉任务中的潜力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

AI视野·今日CS.CV 计算机视觉论文速览
Thu, 26 Sep 2019
Totally 37 papers
?上期速览更多精彩请移步主页

在这里插入图片描述

Interesting:

?高效地残差稠密搜索用于图像超分辨, (from 华为诺亚 悉尼大学)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

?***为深度学习合成数据, (from Steklov Institute of Mathematics Synthesis.ai )
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
TODO(RJJ):基于这个写一个合成数据集的总结帖子

?单图像单元实现视觉感知任务, (from 北理工)
在这里插入图片描述在这里插入图片描述
在这里插入图片描述


?X射线安检, (from Durham University)
dataset:GDXray SIXray

?DeepFakes的构建和检测方法, (from Deakin University, Victoria, Australia )



Daily Computer Vision Papers

Deep Predictive Motion Tracking in Magnetic Resonance Imaging: Application to Fetal Imaging
Authors Ayush Singh, Seyed Sadegh Mohseni Salehi, Ali Gholipour
胎儿磁共振成像MRI受到无法控制的,大的和不规则的胎儿运动的挑战。胎儿MRI以完全互动的方式执行,其中技术人员监视运动以相对于感兴趣的解剖结构以直角指定切片。当前的实践涉及重复获取以确保获取诊断质量的图像,并逐层地回顾性地记录扫描以重建3D图像。但是,基于显示的2D切片进行手动3D胎儿监视以及在切片(而不是切片)堆栈级别进行导航是次佳且效率低下的。当前的过程高度依赖于操作员,需要进行广泛的培训,并且显着增加了胎儿MRI扫描的时间,这使孕妇难以进行扫描,而且费用昂贵。出于这一动机,我们提出了一种使用深度学习的MRI中基于实时图像的新运动跟踪技术,该技术可以显着改善现有技术。通过将空间和时间编码器解码器网络相结合,我们的系统将学习如何基于直接从获取的切片序列中推断出的运动动态来预测胎儿头部的3D姿势。与最近的从片段中估计对象的静态3D姿势的作品相比,我们的方法学会了预测3D运动的动态。我们在保留的测试集中比较了我们训练有素的网络,其中包括具有不同特征的数据,例如不同的年龄范围,并使用旨在估计的网络以及采用的预测方法从志愿者受试者记录的运动轨迹。所有估计和预测任务的结果表明,我们在胎儿MRI中实现了可靠的运动跟踪。可以使用基于深度学习的快速解剖结构检测,分割和图像配准技术来增强此技术,以构建实时运动跟踪和导航系统。

A closer look at domain shift for deep learning in histopathology
Authors Karin Stacke, Gabriel Eilertsen, Jonas Unger, Claes Lundstr m
域移位是组织病理学中的重要问题。在医疗中心和扫描仪之间,整个幻灯片图像的数据特性可能会有很大差异,这使得很难将深度学习推广到看不见的数据。为了更好地理解该问题,我们提出了一项针对卷积神经网络的研究,该卷积神经网络针对H E染色的整个幻灯片图像的肿瘤分类进行了训练。我们分析了增强和规范化策略如何影响性能和学习的表示形式,以及经过训练的模型对功能的响应。最重要的是,我们提出了一种新方法,用于在学习到的特定模型表示的背景下评估域之间的距离。该度量可以揭示模型对域变化的敏感程度,并且可以用于检测模型将普遍存在问题的新数据。结果表明,训练数据的准备如何对学习产生重大影响,并且用于分类的潜在表示对数据分布的变化非常敏感,尤其是在没有扩充或归一化训练的情况下。

MIC: Mining Interclass Characteristics for Improved Metric Learning
Authors Karsten Roth, Biagio Brattoli, Bj rn Ommer
度量学习试图嵌入对象的图像,以使嵌入空间捕获类定义的关系。但是,图像的可变性不仅是由于所描绘的对象类别不同,而且还取决于其他潜在特征,例如视点或照明。除了这些结构化特性之外,随机噪声还阻碍了所关注的视觉关系。度量学习的常用方法是强制执行在所有因素(感兴趣的因素除外)下不变的表示。相反,我们建议显式学习对象类共享的潜在特征。然后,我们可以直接解释结构化的视觉可变性,而不用假定它是未知的随机噪声。我们提出了一种新颖的替代任务,以使用单独的编码器学习跨类共享的视觉特征。通过减少编码器的相互信息,可以与编码器一起针对类信息进行训练。在五个标准的图像检索基准上,该方法大大改进了现有技术。

Deep Learning for Deepfakes Creation and Detection
Authors Thanh Thi Nguyen, Cuong M. Nguyen, Dung Tien Nguyen, Duc Thanh Nguyen, Saeid Nahavandi
深度学习已成功应用于解决各种复杂问题,从大数据分析到计算机视觉和人的水平控制。然而,深度学习的进步也已被用于创建可以对隐私,民主和国家安全造成威胁的软件。 Deepfake是最近出现的那些由深度学习驱动的应用程序之一。 Deepfake算法可以创建伪造的图像和视频,人类无法将它们与真实图像区分开。因此,必须提出一种能够自动检测和评估数字视觉媒体
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值