AI大模型开发架构设计（2）——AI绘画技术架构&应用实践

讲文明的喜羊羊拒绝pua

已于 2024-01-21 23:01:28 修改

阅读量1.5k

点赞数 21

分类专栏： AIGC 文章标签： AIGC AI绘画文生图技术架构

于 2024-01-20 11:11:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yangwei234/article/details/135712713

版权

本文详细阐述了AI绘画的整体流程，包括从输入提示词到生成图像的过程，涉及文生图的核心算法（语言模型、扩散模型和解码模型），以及如何利用微服务和云原生技术实现工程架构的实时弹性。同时介绍了AI绘画的多模态支持应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

- AI绘画技术架构&应用实践

AI绘画技术架构&应用实践

1 AI绘画整体流程

第一步：输入 Prompt 提示词：/mj 提示词
第二步：文生图(Text-to-Image)构图
第三步：图片渲染
第四步：图片展示

2 AI绘画技术架构

文生图核心算法原理

把人类创造的内容用一个高维的数学向量进行表示
- 如果内容到向量的“翻译”足够合理且能代表内容的特征，人类所有的创作内容都可以转化到空间里的向量。
文生图整体可以分为三个部分：Language Model(语言模型)、Diffusion Model(扩散模型)、Decoder Model(解码模型)。

Language Model(语言模型)→Text Encoder(文本编码)

Language Model 是将输入的 Prompt 文本提示词转化为可以输入到 Diffusion Model 使用的表示形式，通常使用 Embedding 加上一些 Radom Noise 输入到下一层。

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

讲文明的喜羊羊拒绝pua 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。