多模态论文笔记——Coca

好评笔记

已于 2025-01-05 14:05:38 修改

阅读量1.3k

点赞数 26

分类专栏：多模态论文笔记文章标签：论文阅读机器学习人工智能深度学习 aigc coca 多模态

于 2025-01-02 10:26:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/haopinglianlian/article/details/144879290

版权

多模态论文笔记专栏收录该内容

16 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍多模态模型Coca，在DALL·E 3中使用其作为captioner基准模型的原因和优势。

在这里插入图片描述

文章目录

ALBEF

论文

模型结构

组成

训练目标

CoCa

论文

模型结构

CoCa 与 ALBEF 对比

训练过程

训练目标

历史文章

机器学习

深度学习

首先我们需要知道Coca是主要用于图像生成文本的。在此之前，我们已经介绍了BLIP和BLIP2，但是BLIP模型生成的文本描述较为简单，模型训练则需要更详细、准确的图像描述或字幕。本文将介绍一个新模型Coca（Contrastive Captioners，谷歌出品），OpenAI的DALL·E 3在处理图像-文本训练数据集就是基于谷歌的CoCa模型，微调一个image captioner，用来合成图像的caption。

DALL·E 3介绍参考DALL·E系列文章：DALL·E 3模型及其论文详解

了解本专栏

超级会员免费看

博客等级

码龄1年

191
原创

5019
点赞

4072
收藏

8470
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 多模态论文笔记——CogVLM和CogVLM2

下一篇：: DALL·E 2模型及其论文详解

最新评论

深度学习笔记——权重初始化、评估指标、梯度消失和梯度爆炸
好评笔记: 哎呦喂，我得把您高贵的置顶了，因为知识付费打扰了您的好心情，怎么说呢，感谢您的好评“写得不错”。
深度学习笔记——权重初始化、评估指标、梯度消失和梯度爆炸
weixin_41980665: 本来看见你文章写得不错，还想给个好评。结果来个收费恶心人。你写这个难道不是为了技术共享，而是赚钱？
多模态论文笔记——NaViT
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
多模态论文笔记——TECO
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
多模态论文笔记——Coca
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

2025

目录

展开全部

收起

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。