文生图的历史
文生图(Text-to-Image Generation)技术的发展历程可以概括为以下几个阶段:
- 早期探索(20世纪60年代-20世纪90年代)
- 依赖规则和模板匹配,生成简单图形。
- 图像质量低,应用场景有限。
- 基于统计模型的方法(2000年代)
- 利用概率图模型和统计语言模型生成图像。
- 图像质量有所提升,但仍较粗糙。
- 深度学习的崛起(2010年代)
- GAN技术的引入极大提高了图像质量。
- DCGAN、Pix2Pix等模型进一步提升细节和逼真度。
- 大规模预训练模型(2020年代)
- CLIP、DALL-E、Stable Diffusion等模型出现。
- 能够生成高质量、复杂图像,广泛应用于多个领域。
文生图基础知识介绍
主要流程
图片来自Task 1学习手册
提示词(Prompts)
- 重要性:提示词对于生成高质量图像