10分钟攻克AI生图“油腻感“难题:腾讯混元SRPO技术登顶HuggingFace热榜

10分钟攻克AI生图"油腻感"难题:腾讯混元SRPO技术登顶HuggingFace热榜

【免费下载链接】SRPO 腾讯SRPO是基于FLUX.1.dev优化的文本生成图像模型,采用Direct-Align技术提升降噪效率,通过语义相对偏好优化实现奖励在线调整。无需依赖离线奖励微调,即可将生成图像的真实感与美学质量提升超3倍,支持ComfyUI快速部署,带来更细腻的画面细节与精准的风格控制 【免费下载链接】SRPO 项目地址: https://ai.gitcode.com/tencent_hunyuan/SRPO

在AI文生图领域,如何突破真实感瓶颈一直是行业痛点。近期,腾讯混元团队联合香港中文大学(深圳)、清华大学推出的SRPO(语义相对偏好优化)技术引发开源社区轰动——该项目自9月10日发布以来,不仅迅速登上HuggingFace热度榜首位,量化版本下载量突破25K,GitCode仓库星标数更是飙升至700+。这项创新技术专门针对当前最流行的开源文生图模型Flux.dev.1,通过革命性的强化学习算法,将人物肖像的真实感提升3倍,彻底解决了困扰业界的皮肤质感"过油"问题。

从"蜡像脸"到"高清肤质":技术突破带来的视觉革命

传统文生图模型生成的人像常出现皮肤过度光滑、细节丢失等"塑料感"问题,而SRPO技术通过精准控制生成过程中的语义偏好,实现了质的飞跃。

展示经过SRPO优化后的文生图效果,人物毛孔清晰、毛发细节分明,真实感显著提升,体现技术对文生图质量的改善。 如上图所示,优化后的人像不仅毛孔纹理清晰可见,发丝根根分明,连皮肤微表情产生的细纹都得到精准还原。这一突破性进展标志着AI生图技术在真实感塑造上进入新阶段,为数字内容创作提供了更专业的视觉表达工具。

双重技术创新:解决文生图领域两大核心难题

语义相对偏好:让AI真正理解"真实感"的含义

传统强化学习方法(如ReFL、DRaFT)依赖预训练奖励模型,不仅数据标注成本高昂,还存在严重的泛化性问题。SRPO技术首创"语义动态调控"机制,通过向奖励模型注入"真实感"等控制提示词,实现优化目标的定向调节。更关键的是,团队创新性提出"正负语义对冲"策略——同时输入正向词(如"自然质感")和负向词(如"塑料感"),利用负向梯度中和模型固有偏差,在保留语义差异的同时有效避免"奖励偏差"风险。实验数据显示,这种双向引导使奖励模型在真实度维度的优化精度提升40%。

Direct-Align策略:重塑图像生成的全轨迹优化

研究团队通过大量实验发现,现有方法仅优化生成轨迹后半段的做法,会导致奖励模型陷入"色彩偏见"陷阱:HPSv2倾向红色调、PickScore偏好紫色系、ImageReward则对过曝区域过度评分。为此,SRPO提出创新的Direct-Align策略,通过可控噪声注入和单步推理机制,将噪声作为"参考锚点"引导图像重建。这种全轨迹优化方法使高频信息传递误差降低62%,彻底解决了传统技术的过拟合问题。

效率与质量的完美平衡:10分钟实现SOTA级性能

在效率为王的AI时代,SRPO展现出惊人的训练效能——仅需10分钟即可完成模型优化,较当前主流方法DanceGRPO提速75倍。更值得关注的是,在人类评估实验中,该技术在"真实感"和"美学质量"两项核心指标上均实现3倍提升,且完全避免了偏色、过饱和等奖励偏差现象。定量测试显示,SRPO在HPSv2、PickScore等主流评价体系中均达到SOTA水平,其技术原理已通过论文《Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference》正式发表(arXiv:2509.06942)。

随着AIGC技术在影视制作、虚拟人、广告创意等领域的深入应用,真实感生成能力正成为产业升级的关键支点。腾讯混元SRPO技术通过将学术创新与产业需求深度耦合,不仅为开源社区提供了高效可用的技术方案,更树立了"小样本、高效率、高精度"的模型优化新范式。未来,随着该技术在多模态生成、跨领域迁移等方向的拓展,我们或将迎来AI内容创作的"超写实主义"新纪元。

(论文链接:https://arxiv.org/abs/2509.06942 项目主页:https://tencent.github.io/srpo-project-page/)

【免费下载链接】SRPO 腾讯SRPO是基于FLUX.1.dev优化的文本生成图像模型,采用Direct-Align技术提升降噪效率,通过语义相对偏好优化实现奖励在线调整。无需依赖离线奖励微调,即可将生成图像的真实感与美学质量提升超3倍,支持ComfyUI快速部署,带来更细腻的画面细节与精准的风格控制 【免费下载链接】SRPO 项目地址: https://ai.gitcode.com/tencent_hunyuan/SRPO

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值