在当今的科技世界里,深度学习图像生成技术正以惊人的速度发展。此前,在图像合成领域,Stable Diffusion一直占据主导地位,然而,随着Black Forest Labs发布的FLUX模型的问世,这一格局发生了改变。
FLUX的诞生背景与团队实力
FLUX由Black Forest Labs团队创建,该团队主要由前Stability AI的员工组成。团队中的工程师直接参与了VQGAN、Latent Diffusion以及Stable Diffusion模型套件的开发与发明,这为FLUX的强大性能奠定了坚实的基础。
FLUX模型的技术亮点
目前,关于FLUX模型开发的公开信息有限,但我们已经了解到一些关键的改进。所有公开的FLUX.1模型基于“多模态和并行扩散变压器块的混合架构,并扩展到120亿参数”。在训练方面,采用了基于连续归一化流的流匹配训练方法,而非传统的扩散路径,这种方法在似然性和样本质量方面都比基于扩散的替代方法表现更优。此外,通过引入旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。
FLUX不同版本的特点
为了满足不同用户的需求,Black Forest Labs发布了三个版本的FLUX:Pro、Dev和Schnell。
- FLUX.1 p