EyeGAN: Gaze-Preserving, Mask-Mediated Eye Image Synthesis

EyeGAN: Gaze-Preserving, Mask-Mediated Eye Image Synthesis

生成指定凝视方向眼球图像

本文的重点就是生成凝视指定方向的眼球图像。在作者之前已有的生成性对抗网络可以说产生了很好的生成眼球的结果。然而,控制生成图像的凝视方向已被证明是难以捉摸的。因此作者提出了基于cycleGAN的EyeGAN来生成确定凝视方向的眼睛图像。

一、摘要

具有指定注视方向的真实眼睛图像的自动合成对于多个应用领域是重要的。我们引入了EyeGAN,一种以期望的目标域的样式生成眼睛图像的算法,它继承了来自源域的图像中可用的注释。EyeGAN接受输入的三值遮罩,这些遮罩用作凝视方向的独立于域的代理。我们通过测量特定的凝视一致性指数来评估EyeGAN与竞争对手的眼睛图像合成算法的对比。此外,我们从多个实验(包括眼睛区域分割、瞳孔定位和注视方向估计)中得出的结果表明,与其他域转移算法相比,使用带有继承注释的眼睛生成图像进行网络训练具有更好的性能。

二、相关工作

1.UnityEyes

一种将大量可变眼区图像快速合成为训练数据的新方法。该方法结合了人眼区域的新型生成3D模型和实时渲染框架。该模型基于高分辨率的3D人脸扫描,并使用复杂的眼球材料和结构的实时近似,以及眼睑动画的解剖启发程序几何方法。我们表明,这些合成图像可用于估计在困难的野外场景中的凝视,即使是极端的凝视角度,或在瞳孔完全被遮挡的情况下。尽管只使用轻量级的近邻算法,也可以在野生数据集上获得具有竞争力的凝视估计结果。
可在线使用 UnityEyes 合成框架。

2.CycleGAN

CycleGAN本质上是两个镜像对称的GAN,构成了一个环形网络。
两个GAN共享两个生成器,并各自带一个判别器,即共有两个判别器和两个生成器。一个单向GAN两个loss,两个即共四个loss。

3.Pix2pix

图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,比如灰度图、梯度图、彩色图之间的转换等。通常每一种问题都使用特定的算法(如:使用CNN来解决图像转换问题时,要根据每个问题设定一个特定的loss function 来让CNN去优化&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值