
论文
文章平均质量分 77
少司、
这个作者很懒,什么都没留下…
展开
-
Nerf + 3D生成
3D生成原创 2022-06-18 23:16:31 · 434 阅读 · 0 评论 -
Transform:Attention--VIT--Swin_T
目录reference:建议看李沐大神b站视频1、attention点积式的attention机制多头注意力机制2、transform模型里面怎么使用注意力机制编码器的输入的注意力解码器的注意力解码器的另一个注意力3、feed forward4、embedding5、positional encoding6、Normreference:建议看李沐大神b站视频1、attention点积式的attention机制假设Q是(n,dk)维度..原创 2022-05-11 20:11:03 · 453 阅读 · 0 评论 -
e4e反演框架:Designing an Encoder for StyleGAN Image Manipulation
这里记录下本文学到的概念:一、W空间e4e原文在intro第三段描述:由于并不是所有的图都W空间,W空间表达能力有限在下文Image2stylegan: How to embed images into the stylegan latent space?e4e使用的是W+空间,二、两种Latent Space Embedding1、 learn an encoder that maps a given image to the latent spaceencoder方法例如..原创 2022-04-15 15:58:48 · 3902 阅读 · 0 评论 -
SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
介绍先前的工作(指的是pix2pix,pix2pixHD)是:semantic layout 作为网络input。作者认为由于normalization会洗掉语义信息,提出网络的输入the input layout for modulating the activations in normalization layers through a spatially adaptive, learned transformation.通过空间自适应学习转换使用输入语义布局来调制激活函数,这个翻译我一直不怎么.原创 2022-04-10 17:27:07 · 4230 阅读 · 0 评论 -
pix2pixHD: High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
摘要1、a novel adversarial loss, as well as new multi-scale generator and discriminator architectures.2、edit介绍(改进什么)1、语义生成两个(2018年)sota架构:pix2pix架构,高分辨率不稳定;a modified perceptual loss缺少细节和纹理2、对抗训练,perceptual losses from pre-trained networks对于intera原创 2022-04-09 18:12:34 · 986 阅读 · 0 评论 -
CVPR2022-SemanticStyleGAN
这是一篇来自CVPR2022关于GAN的新作:文章效果经验,引入了语义图进行解耦,很有新意。原创 2022-03-23 00:20:53 · 5681 阅读 · 4 评论