文生图模型评测之PickScore

PickScore：评估文生图模型的新标准

funNLPer

已于 2023-11-09 21:41:23 修改

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏： AI算法文章标签： AIGC 人工智能 stable diffusion Imagen

于 2023-11-09 21:40:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/orangerfun/article/details/134275052

AI算法专栏收录该内容

26 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

PickScore是一个基于CLIP的打分模型，用于评估文本到图像生成（文生图）模型的性能。它利用用户在Pick-a-Pic web App中表达的偏好数据进行训练，该数据集包含超过50万个样本。模型可以用于模型选择、构建高质量数据集和改进文生图模型。

在这里插入图片描述

文章目录

1. 简介
2. 构建数据集
- 2.1 Pick-a-Pic web App
- 2.2 Pick-a-Pic Dataset
3. PickScore
4. 作用
- 4.1 作为验证模型的验证集
- 4.2 用于模型选择
5. 小结

论文链接：Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation
代码/数据链接：yuvalkirstain/PickScore
🤗关注微信公众号 funNLPer，分享有用的算法知识🤗

PickScore是一个文生图打分模型，作者在公开模型的同时也公开了他们收集的人类偏好数据集，该模型即可作为文生图模型的评价标准，也可作为类似于RLHF中奖励函数。而对于作者公开的人类偏好数据集则对文生图中RLHF具有重要作用，同时研究者们也可基于该数据集训练打分模型。

1. 简介

从文生图用户中收集大量的人类偏好数据一般只能是大公司才能做到，普通研究者很难收集到这种数据。因此本文制作了一个web应用，用户在该应用上可以使用文生图模型生成各种图片，并且指出他们对图片的偏好。通过这个应用本文收集了大量的文生图prompts以及用户对生成图片的偏好。作者利用该数据集训练了一个基于CLIP的打分函数PickScore，PickScore在预测人类偏好任务上展示了惊人的效果。

2. 构建数据集

2.1 Pic

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。