增强现实中的深度学习应用:图像合成、人脸滤镜与3D模型生成
1. 图像合成与阴影生成
在一些增强现实(AR)应用中,简单地将虚拟对象放置在现实世界背景上可能就足够了,比如在相机流上添加标签、图标或其他覆盖物的移动应用。然而,随着我们追求更沉浸式的混合现实体验,我们期望虚拟对象能与现实世界在颜色、光照和阴影方面保持一致,这个过程被称为图像协调。
利用生成对抗网络(GAN),图像协调可以被视为一个图像到图像的转换问题,即将背景图像的风格转移到前景图像上。但生成阴影比普通的图像到图像转换更为复杂,也是许多基于GAN的图像合成研究的重点。传统的阴影生成方法需要明确的光照、材料属性和几何信息,而这些信息通常难以获取,需要进行估计,而且估计计算困难,不准确时结果也不可信,因此GAN方法显得很有吸引力。
以下是几种基于GAN的阴影生成方法:
- Mask - ShadowGAN :这实际上是一种阴影去除方法,使用类似于CycleGAN的循环一致架构,在未配对图像上训练模型。输入的阴影图像首先被转换为无阴影图像,两者相减得到一个阴影掩码,描绘出被去除阴影的位置和形状。无阴影图像与阴影掩码合成可恢复原始图像,从而保持循环一致性。该架构可以通过提供阴影掩码在无阴影图像上生成阴影,但并不总是实用。
- ShadowGAN :这是第一个已知的基于GAN的阴影生成器,需要输入对象掩码和无阴影输入图像,掩码描绘的是对象而非阴影,然后生成阴影。它在配对图像上进行训练,一个训练实例包含一个或多个带有可见阴影的现实世界对象、一个无阴影的虚拟插入对象、插入对象的掩码以及带有适当渲染阴影的真实图像。该方法一次只能处理一个插
超级会员免费看
订阅专栏 解锁全文
1153

被折叠的 条评论
为什么被折叠?



