AI绘画技术架构&应用实践
1 AI绘画整体流程
- 第一步:输入 Prompt 提示词:
/mj 提示词
- 第二步:文生图(Text-to-Image)构图
- 第三步:图片渲染
- 第四步:图片展示
2 AI绘画技术架构
文生图核心算法原理
- 把人类创造的内容用一个高维的数学向量进行表示
- 如果内容到向量的“翻译”足够合理且能代表内容的特征,人类所有的创作内容都可以转化到空间里的向量。
- 文生图整体可以分为三个部分:Language Model(语言模型)、Diffusion Model(扩散模型)、Decoder Model(解码模型)。
Language Model(语言模型)→Text Encoder(文本编码)
- Language Model 是将输入的 Prompt 文本提示词转化为可以输入到 Diffusion Model 使用的表示形式,通常使用 Embedding 加上一些 Radom Noise 输入到下一层。