Prompt-to-Prompt Image Editing with Cross Attention Control

最新推荐文章于 2024-11-14 19:39:33 发布

尔呦

最新推荐文章于 2024-11-14 19:39:33 发布

阅读量747

点赞数 9

分类专栏： paper reading 文章标签： prompt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44994838/article/details/143134431

版权

paper reading 专栏收录该内容

22 篇文章

订阅专栏

https://arxiv.org/pdf/2208.01626

问题引入

通过manipulate cross attn map的方式来实现图片编辑的任务；

methods

编辑前后的图片以及prompt $I,I^*,P,P^*$ ，在cross attn中，pixel feature $\phi(z_t)$ 得到 $l_Q(\phi(z_t))$ ， $l_K(\psi(P)),v = l_V(\psi(P))$ ，得到atten map $M$ ，其中 $M_{ij}$ 表示的是 $j - t h$ 的token和pixel $i$ 之间的关系；
编辑的算法如下：
其中 $Edit(M_t,M_t^*,t)$ 根据任务不同定义如下：
word swap：
Adding a New Phrase：
Attention Re–weighting：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。