AI绘画 FLUX 成为图片生成新王者,超写实人物生成，毫无AI油腻感！？

最新推荐文章于 2025-02-24 11:09:05 发布

原创最新推荐文章于 2025-02-24 11:09:05 发布 · 1.5k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #AI作画 #stable diffusion #AI绘画 #comfyui #计算机 #科技

部署运行你感兴趣的模型镜像

大家好我是AIGC阿道夫

马斯克的 Grok-2 发布，加入了 FLUX 模型提供的文生图能力。

FLUX 模型，来自于德国创业公司 Black Forest Labs，拳打 MJ 脚踩 SD，图片质量做到了行业天花板，道德底线也压到了地板砖。

01 生成质量高，

内容「毫无限制」

首先在 X 上引起热议的，是前几天网友制作的 TEDx AI 讲师。

仔细看，嘉宾卡上的 Google 字样与真实的 logo 毫无区别。

比如这张华人讲师：

而在图片准确性上，FLUX 可以说直接把 Gemini 摁在地上打。Black Forest Labs 的董事 Anjney Midha 在 X 上发布了一系列比较的图片，关于一些历史人物的准确性的对比。

一幅古希腊哲学家的画像，左侧为 Gemini，右侧为 Grok 2。

一位超级碗夺冠的四分卫。

几乎「没有任何限制」的文生图

Grok 2 发布后，很多网友发现，FLUX 几乎在生成图像上没有做任何限制。特朗普、迪士尼米老鼠、泰勒·斯威夫特等等诸多在别的 AI 工具里无法生成的内容，在 FLUX 上都可以生成。

比如老少咸宜的米老鼠。

忍者神龟版的马斯克。

发胖版的马斯克。

根据 Artificial Analysis 的数据，Black Forest Lab 的 FLUX.1 模型在质量方面超越了 Midjourney 和 OpenAI 的 AI 图像生成质量，至少从用户在图像领域的排名来看是这样。

从质量和生成成本上来看，FLUX.1 [schnell] 遥遥领先。

与其他文生图产品不同，Grok 不会拒绝涉及真人的提示词，也不会在其输出中添加识别水印。

这种无限制，可能也是马斯克会选择 FLUX 的原因之一，马斯克此前曾多次表示，给大模型设置安全措施会降低 AI 的安全性。

02 种子轮 a16z 投资，

上来就跟大公司合作

8 月 1 日成立，Black Forest Labs 目前已完成 3100 万美元的种子轮融资，由 a16z 领投，还有 Y Combinator 首席执行官 Garry Tan 和 Oculus 前首席执行官 Brendan Iribe，以及一些知名 AI 研究专家。

本次发布的 FLUX.1 模型，也按照能力的不同，在商业使用上有所不同。

FLUX.1 [pro]，全新的 SOTA 文生图模型，具有极其丰富的图像细节、极强的 prompt 遵循能力和多样化风格。目前可以通过 API 使用，只开放商用权限。

FLUX.1 [dev]，FLUX.1 [pro] 的开放权重、非商用变体，基于后者蒸馏而成。该模型的表现优于 Midjourney 和 Stable Diffusion 3 等其他图像模型。推理代码和权重已经放在了 GitHub 上。

开源的 FLUX.1 [schnell]，它是超高效的 4-step 模型，遵循了 Apache 2.0 协议。该模型在性能上与 [dev]、[pro] 非常接近，可以在 Hugging Face 上使用。

考虑到初始团队大都来自 Stable Diffusion，这次的模型发布也覆盖了商用、开源权重到完全开源，能力最强的提供商用和企业合作的机会，基础版权完全开源。

跟 Stable Diffusion 不同的是，这次 Black Forest Labs 和 xAI 进行了合作，为 Grok 2 提供了图像生成功能，怎么说，算是一个双赢的合作，不管是吸引更多用户，还是积累更多数据进行数据飞轮。

而对 Black Forest Labs 来说，这次合作带来的算力和资金的支持，应该也可以帮助他们的模型得到更快的提升。

03 成员来自 Stable Diffusion 核心团队

这家总部位于德国的公司由 Robin Rombach、Andreas Blattmann 和 Dominik Lorenz 领导，他们都曾是 Stability AI 公司的工程师，以及其他开发基于扩散的人工智能模型的领军人物。

Robin Rombach 是开发出文生图模型 Stable Diffusion 的两位主要作者之一，而 Andreas Blattmann 和 Dominik Lorenz 也都是知名论文《High-Resolution Image Synthesis With Latent Diffusion Models》的主要作者。

他们之前的代表性工作包括 VQGAN 和 Latent Diffusion、图像和视频生成领域的 Stable Diffusion 模型（包括 Stable Diffusion XL、Stable Video Diffusion 和 Rectified Flow Transformers）以及用于超快实时图像合成的 Adversarial Diffusion Distillation。

可以说，Black Forest Labs 就是一个增强版的 Stable Diffusion。

他们将有可能引领开源文生图的再一次新风潮，甚至改写文生图领域的进程。

在他们的官方介绍中，下一步计划推出 SOTA 文生视频模型，为视频生成技术打下基础，目标是为所有人提供最先进文生视频技术。

现在AI绘画还是发展初期，大家都在摸索前进。

但新事物就意味着新机会，我们普通人要做的就是抢先进场，先学会技能，这样当真正的机会来了，你才能抓得住。

如果你对AI绘画感兴趣，我可以分享我在学习过程中收集的各种教程和资料。

学完后，可以毫无问题地应对市场上绝大部分的需求。

这份AI绘画资料包整理了Stable Diffusion入门学习思维导图、Stable Diffusion安装包、120000+提示词库，800+骨骼姿势图，Stable Diffusion学习书籍手册、AI绘画视频教程、AIGC实战等等。

完整版资料我已经打包好，点击下方卡片即可免费领取！
请添加图片描述