论文解读 IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models

不当菜鸡的程序媛

已于 2025-03-24 09:58:15 修改

阅读量556

点赞数 4

CC 4.0 BY-SA版权

分类专栏： Diffusion 文章标签： stable diffusion

于 2024-12-18 23:25:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/vivi_cin/article/details/144572029

转载：unet中的attn_processor的修改（用于设计新的注意力模块）_attnprocessor-优快云博客

【扩散模型（四）】IP-Adapter 源码详解2-训练核心（cross-attention）_ip-adapter.bin-优快云博客

IP-Adapter的示意图：

IP-Adapter的ImageEncoder代码：

 @torch.inference_mode()
    def get_image_embeds(self, pil_image=None, clip_image_embeds=None):
        if pil_image is not None:
            if isinstance(pil_image, Image.Image):
                pil_image = [pil_image]
            clip_image = self.clip_image_processor(images=pil_image, return_tensors="pt").pixel_values
            clip_ima

最低0.47元/天解锁文章

200万优质内容无限畅学

不当菜鸡的程序媛

博客等级

码龄8年

376
原创

1505
点赞

1664
收藏

1482
粉丝

关注

私信

分类专栏

展开全部收起

上一篇：: Stable Diffusion模型微调LORA及其变种介绍

下一篇：: 人脸对齐代码

最新评论

Tpami投稿注意事项
xxyh1993: IEEE的latex模板全是坑。。。下下来不能直接用，一定要挨个试试它们提供的IEEEtrans.cls的可选参数，比如compsoc等
论文阅读Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读Att-Adapter: A Robust and Precise Domain-Specific Multi-Attributes T2I Diffusion Adapter via Con
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读Continuous, Subject-Specific Attribute Control in T2I Models by Identifying Semantic Directions
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读HARIVO: Harnessing Text-to-Image Models for Video Generation
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。