文生图模型评测之PickScore

PickScore是一个基于CLIP的打分模型,用于评估文本到图像生成(文生图)模型的性能。它利用用户在Pick-a-Pic web App中表达的偏好数据进行训练,该数据集包含超过50万个样本。模型可以用于模型选择、构建高质量数据集和改进文生图模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

论文链接:Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation
代码/数据链接:yuvalkirstain/PickScore
🤗关注微信公众号 funNLPer,分享有用的算法知识🤗

PickScore是一个文生图打分模型,作者在公开模型的同时也公开了他们收集的人类偏好数据集,该模型即可作为文生图模型的评价标准,也可作为类似于RLHF中奖励函数。而对于作者公开的人类偏好数据集则对文生图中RLHF具有重要作用,同时研究者们也可基于该数据集训练打分模型。

1. 简介

从文生图用户中收集大量的人类偏好数据一般只能是大公司才能做到,普通研究者很难收集到这种数据。因此本文制作了一个web应用,用户在该应用上可以使用文生图模型生成各种图片,并且指出他们对图片的偏好。通过这个应用本文收集了大量的文生图prompts以及用户对生成图片的偏好。作者利用该数据集训练了一个基于CLIP的打分函数PickScore,P

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值