基于图像的虚拟试衣:VITON:An Image-based Virtual Try-on Network(2018)

VITON是一个2018年的研究工作,提出了一个图像为基础的虚拟试衣网络,用于合成人穿上目标衣服的效果。网络采用多任务编码器-解码器结构,结合人体姿态热图、人体分割和脸部头发分割信息,生成逼真的试衣图像。通过细节网络进行精细化处理,处理衣服变形和合成图像的细节。实验结果显示,VITON在保留人物姿势、身体形状和目标衣服细节方面表现出色。

[paper]VITON: An Image-based Virtual Try-on Network(2018)
[code]VITON

效果

在这里插入图片描述

网络结构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 人的量化表示

    • 人姿态热图
      人的姿态用18个关键点表示。为了利用空间布局,每个关键点都将进一步转换为热图,关键点周围11x11领域设置为1,其他位置区域设置为0。然后将热图堆叠到18通道的姿势热图中。
    • 人体表示
      衣服的外观高度取决于人身体不同部位的位置和形状,使用人体解析算法对人身体的不同部位进行分割,将分割图进一步转换为1通道的二进制掩码,其中除了人脸和头发人身体用1表示,其他都用0表示。二进制掩码图下采样到较低的分辨率,避免在身体形状和目标衣服发生冲突出现伪像。
    • 人脸和头发分割
      使用人体分析提取人的脸部和头发区域的RGB通道,用来在生成新图像时注入身份信息。
      在这里插入图片描述
  • 多任务编解码生成器
    给定衣服无关的人的表示p和目标衣服c,通过cp中相应区域的转换的重构方式来合成参考图像。利用多任务编码器-解码器框架,生成穿衣服的人像以及该人的衣服蒙版,进一步使用预测的衣服蒙版来细化所生成的结果。编码器-解码器是U-Net体现结构的一种通用类型,使用跳过连接可以通过旁路连接直接在层之间共享信息。
    G C G_C GC表示编码器-解码器生成器,输入目标衣服 c c c和人的表示 p p p,输出合成图像 I ′ I' I(3通道彩色图像)和衣服掩码 M M

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值