AIGC 文生图零基础第二期

最新推荐文章于 2025-12-06 18:19:10 发布

原创最新推荐文章于 2025-12-06 18:19:10 发布 · 688 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#AIGC #python #conda

精读代码，实战进阶

前面我们跑通了baseline，对baseline的代码也有了一个基本的理解，相信大家也对本次的学习充满信息，那么我们就在Task1的基础上继续深入。

今天我的任务是对baseline的代码有一个更加细致的理解，然后学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画。

辅助工具准备

使用通义千问：
通义tongyi.ai_你的全能AI助手 (aliyun.com)

代码详解

对于上一期实际做的修改

1.图像描述词修改

以图像1为例

通义返回的正面词为：古风, 水墨画, 黑色长发少女, 淡雅汉服, 简单发饰, 古典书房, 四周环绕竹简书架, 专注听讲, 手拿毛笔, 面前展开宣纸, 上半身

所以我们在图像中午描述中写上：

注意：为防止与上一次图像冲突，需要修改文件名或者是更改生成目录。

2.最后返回大模型参数时修改寻找位置或者文件名

输出图像

我采取的迭代次数仅为30，可见与50次对比意义上稍显不明

对比思考

通过八张图片我们可以看到对于关键词DiffSynth-Studio在30次迭代下对于我们的图像已经能够初步表达效果，但是由于在第二层网络中并未强调图片的联系性，所以图片虽然在表层网络中有大致外貌上的相似，但是实际看来却并无故事联系感，推荐修改参数：

alpha=2.7

rank= 23

迭代次数改为100

增加字条连续

可得到如下图像，仅为第一张

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。