近年来,人工智能的发展使得文本到图像(T2I)技术日益成熟,但同时也伴随着高昂的训练成本。然而,华为诺亚方舟实验室等机构最近提出的PixArt-α模型,打破了这一局限。PixArt-α能够以极低的成本(仅26000美元)在相对短时间内(约675 A100 GPU 天)完成训练,相比传统的大型T2I模型,如RAPHAEL,大幅降低了成本。
-
huggingface模型下载:https://huggingface.co/PixArt-alpha/PixArt-XL-2-1024-MS
-
AI快站模型免费加速下载:https://aifasthub.com/models/PixArt-alpha/PixArt-XL-2-1024-MS
技术创新带来的质变
华为诺亚方舟实验室推出的PixArt-α模型,在文本到图像(T2I)技术领域实现了重大突破。该模型以极低的训练成本(约26000美元)和训练时间(约675 A100 GPU天),在图像生成质量上媲美市场领先的模型,如Midjourney(MJ)和Stable Diffusion XL(SDXL),同时实现了高达1024×1024分辨率的高质量图像生成。
训练策略分解的优势
PixArt-α采用的训练策略分解方法是其核心创新之一。通过将训练过程细分为优化像素间依赖、文本图像对齐和图像美学质量的三个阶段,模型能够更加高效地学习和生成复杂图像。这种分阶段的