基于图像的虚拟试衣：VITON:An Image-based Virtual Try-on Network(2018)

最新推荐文章于 2024-08-13 21:03:45 发布

原创

最新推荐文章于 2024-08-13 21:03:45 发布 · 3.4k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#VITON #Virtual Try-On #图像

VITON是一个2018年的研究工作，提出了一个图像为基础的虚拟试衣网络，用于合成人穿上目标衣服的效果。网络采用多任务编码器-解码器结构，结合人体姿态热图、人体分割和脸部头发分割信息，生成逼真的试衣图像。通过细节网络进行精细化处理，处理衣服变形和合成图像的细节。实验结果显示，VITON在保留人物姿势、身体形状和目标衣服细节方面表现出色。

[paper]VITON: An Image-based Virtual Try-on Network(2018)
[code]VITON

效果

在这里插入图片描述

网络结构

在这里插入图片描述

人的量化表示
- 人姿态热图
  人的姿态用18个关键点表示。为了利用空间布局，每个关键点都将进一步转换为热图，关键点周围11x11领域设置为1，其他位置区域设置为0。然后将热图堆叠到18通道的姿势热图中。
- 人体表示
  衣服的外观高度取决于人身体不同部位的位置和形状，使用人体解析算法对人身体的不同部位进行分割，将分割图进一步转换为1通道的二进制掩码，其中除了人脸和头发人身体用1表示，其他都用0表示。二进制掩码图下采样到较低的分辨率，避免在身体形状和目标衣服发生冲突出现伪像。
- 人脸和头发分割
  使用人体分析提取人的脸部和头发区域的RGB通道，用来在生成新图像时注入身份信息。
多任务编解码生成器
给定衣服无关的人的表示p和目标衣服c，通过c到p中相应区域的转换的重构方式来合成参考图像。利用多任务编码器-解码器框架，生成穿衣服的人像以及该人的衣服蒙版，进一步使用预测的衣服蒙版来细化所生成的结果。编码器-解码器是U-Net体现结构的一种通用类型，使用跳过连接可以通过旁路连接直接在层之间共享信息。
用 $G_C$ 表示编码器-解码器生成器，输入目标衣服 $c$ 和人的表示 $p$ ，输出合成图像 $I^{'}$ （3通道彩色图像）和衣服掩码

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。