消费级显卡,17G显存,玩转图像生成模型FLUX.1!ModelScope
从模型架构上看,FLUX.1和SD3有很多相似之处,都是基于FlowingMatching调度的模型,都通过引入T5来增强prompt的依从性。而比较显著的区别在于:flux模型引入了一种叫DoubleStreamBlock的结构,具体来说在前几层layer中,采用了txt和img embedding独立过各自的transformer块,然后再拼到一起过统一的transformer块,我们推测是为了进一步对齐图像和文本特征,但是这部分还没有更具体的技术报告。风格上,个人认为风格属性一般。
原创
2024-08-06 15:26:21 ·
2290 阅读 ·
0 评论