生成一致角色的前沿模型:全面对比测评
同一角色在8个不同场景中展示的效果
在不久前,要保证生成角色一致性生成想要的图片:
首先要训练角色的LoRA,其次要在工作流中组合使用ControlNets、IPAdapters,才能生成自己想要的图片
现在可以使用,这些主流的闭源模型,就可以达到精准又逼真的图像
提示词:she is wearing a pink t-shirt with the text “Replicate” on it
FLUX.1 Kontext有三个版本:Pro、MAX、 Dev(开源版本)
Dev可在OneThingAI上进行使用: 解决方案 - OneThingAI算力云 - 热门GPU算力平台
接下来,我会对这四个模型从生图速度到使用成本上进行多维度的对比
下面的对比中,我们用的是设置了高质量和高保真度的 gpt - image - 1。我们选择 FLUX.1 Kontext Pro,是因为它在质量和速度之间找到了最佳平衡点。我们用的 Gen - 4 Image 是 1080p 的。
1、照片级精度
展示了每个模型的优势与劣势,所有示例均聚焦于照片级输出效果。
2、构图精度
我们能看到 Gen-4 的优势正逐渐显现。其构图最具吸引力,人物塑造也最为精准。
提示词:she is playing the piano
提示词:he is playing the guitar
3、微调场景
若你希望保留原始构图的大部分内容,仅对场景的一小部分进行修改,所有模型都能出色地完成这项任务。
提示词:remove the glass of drink
展示的是一位双发异瞳的美少女
提示词:a half-length portrait photo of her in a summer forest
精致男孩一键输出
提示词:remove his beard, put him in a raincoat, it is raining
酷酷型男也有温柔的一面
提示词:he is a chef cooking a meal in a restaurant kitchen
动漫风、油画风一键生成
提示词:
1、restyle this person as anime
2、make this a watercolor painting
七十二变,随手就来,化身为女巫,化身为浩克
提示词:
1、make her a witch
2、turn him into a green skinned ogre
总结:
- Kontext Pro 用途广泛,能产出极佳效果,但面部周围往往会出现过多瑕疵,这些瑕疵常导致图像无法使用(Kontext Dev 中似乎不存在这些瑕疵,但 Dev 的整体质量较低)。
- gpt-image-1 总会添加一种独特的黄色调,即便启用了高质量和高保真度设置,人物身份也常常会发生变化。由于其成本最高且速度最慢,我们只会在处理最复杂的任务时才使用它。
- SeedEdit 3 往往局限于初始构图,难以根据提示呈现新的角度或场景。其输出通常较为柔和,且更像是 AI 生成的。在复杂场景中,连贯性也是一个问题。
- 就照片中的相似度而言,Runway 的 Gen-4 适应性最强且最为精准。它的主要缺点是在复杂场景中缺乏连贯性,可能会出现一些意想不到的手臂、肢体或手部形态。有时通过几次重试可以解决这个问题,有时则无法解决。此外,Gen-4 也无法对场景进行重新风格化处理。
建议:
- 处理照片时,你应当从 Runway 的 Gen-4 图像模型入手。如果需要更快或更经济的输出结果,那么 Kontext Pro 是次佳选择。要是 Gen-4 生成的部分结果缺乏连贯性,你完全可以将其交由 Kontext Pro 进行修复。
- 对于更具创意的任务以及完整的角色转换,建议先尝试使用 Kontext Pro。如果任务更为复杂,且你能承担相应成本,也可以试试 gpt-image-1。如果你负担不起 gpt-image-1 的费用,且 Kontext Pro 效果不佳,SeedEdit 3 是个不错的廉价替代方案。请勿将 Gen-4 用于风格化任务。
本次内容就到这里,敬请期待更多模型、对比内容。不妨去解决方案 - OneThingAI算力云 - 热门GPU算力平台尝试更多模型,也可以在微信关注公众号:OneThingAI,获取最新AI资讯