- 博客(2)
- 收藏
- 关注
原创 stable diffusion相关好文
首先,用U-Net预测没有文本特征引导的原图X0,然后用U-Net预测有文本特征引导的原图X0_word,利用(X0_word - X0)我们可以得到文本特征的区域,提高它的权重,并将其加到X0上,比如这个权重是8,那么最终的输出就是X0+8*(X0_word - X0)。2,这里借用链接2中的一张图片,左边是训练时候的样子,由1可知,红色框内的公式就是XT,将XT和时间步长t作为输入,去预测噪声,并将预测得到的噪声与添加的真实的噪声计算损失。2,训练的loss,是网络预测的噪声与真实的噪声的L2损失。
2023-09-14 15:18:36
127
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人