Midjourney发布新特性风格参考

本文介绍了Midjourney推出的风格参考工具,该工具可参考其他图像风格生成一致图像。详细阐述了其新增功能,如更准确理解风格元素等,还通过多个例子展示效果,分析了提示词参数,包括参考图片URL、样式权重、宽高比等,最后指出可使用多个参考图片,用户对生成图像控制更精准。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 引言

最近,Midjourney 推出了Style Reference V2.0 即功能更加强大的风格参考工具,该工具可以让大家参考其他图像的风格,生成与参考图像风格保持一致,与文本提示词语义内容保持一致的图像。它与图像提示类似,但是只关注参考图像的风格样式。

关于其更新的功能描述,我们在下文一一进行展开!

2. 新增功能

本次Midjourney更新所带来的新功能总结如下:

  • 更加准确地理解风格元素
  • 更好地避免非风格元素渗入图像
  • 改进了权重参数的功能,使得控制更加精细
    在这里插入图片描述

3. 效果初探

直接前往 Discord上的Midjourney Bot, 上传大家的参考图像即可。我们先来选择一张参考图像,如下:
在这里插入图片描述
右键点击图像,并选择 "复制图像地址 "选项。
在这里插入图片描述
现在,使用以下提示词和上述参考图像的风格,来生成一组新的图像

Prompt: three bears under a big tree — sref https://s.mj.run/CEx04TrK2ek — ar 4:3 — sw 1000

提示: 大树下的三只熊 — sref https://s.mj.run/CEx04TrK2ek — ar 4:3 — sw 1000

就可以得到结果如下所示:

在这里插入图片描述

4. 参数分析

仔细观察上述生成的图像,它捕捉到了参考图像的精髓,这真是令人难以置信。捕捉到的细节,甚至是皱巴巴的纸张纹理,都令人叹为观止。我们不妨来分析一下上述提示词中的参数:

  • 参数--sref表示其后跟上参考图片的URL地址
  • 参数--sw表示更新样式的权重,取值范围为0-1000,如果需要减弱样式的影响,可将权重设置为 --sw 0,而使用--sw 1000生成的图像会更加贴近参考图像
  • 参数 --aspect或者--ar可以控制生成图像的宽高比

这里,不妨让我们尝试使用强度--sw 500来试试另一个例子,参考图像如下所示:
在这里插入图片描述
​提示词如下所示:

Prompt: an image of a cute pug wearing fashionable clothes — sref https://s.mj.run/HolvSW18Z54 — sw 500

提示:可爱的哈巴狗穿着时尚服装的形象 — sref https://s.mj.run/HolvSW18Z54 —sw 500

得到的生成图像如下所示:
在这里插入图片描述

5. 其他例子

为了更直观地显示使用和不使用样式参考参数的输出结果之间的差异,我们来看下面的例子,所选择的参考图像如下:
在这里插入图片描述
​提示词如下:

Prompt: an image of a girl sitting on a couch. 1980s, Retro illustration, Riso print, Vintage paint
提示:一个女孩坐在沙发上的图像。20 世纪 80 年代, 复古插画, Riso 印刷, 复古风格

这里我们来比较使用 --sref参数和不使用该参数的差异,得到对比结果如下:
在这里插入图片描述
我们也可以在任何文本提示中通过参数--sref来使用上述风格图像。请看下面这个例子,将上面的复古风格用在了一只狗身上,结果如下:

在这里插入图片描述

6. 使用多个参考

更一般的来说,我们也可以通过包含多个 URL 来使用多个参考图片。只需要大家在文本提示后输入 --sref,然后输入一个或多个样式参考图像的 URL,如下所示:--sref urlA urlB urlC

这里我们选择以下三张图像作为我们的参考图像:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
我们所选用的文本提示如下:

prompt: A { violin, bird, piano} surrounded by flowers, --sref urlA urlB urlC

提示:一个 { 小提琴、小鸟、钢琴} 周围环绕着鲜花,–sref urlA urlB urlC

得到结果如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这是根据上述三张参考图片生成的图像。它完美地结合了上述参考图像中的美感。

7. 总结

总之,Midjourney再次证明,他们是风格转换方面的最佳工具。现在,用户对生成图像的风格和美感的控制水平和精确度是无与伦比的。作为人工智能艺术爱好者,我非常期待看到AI绘画的下一次变化。也许在不久会有更多全新的功能涌现?让我们拭目以待!

注: 相关素材来自互联网,供学习交流使用,侵权删!

内容概要:本文详细介绍了基于FPGA的144输出通道可切换电压源系统的设计与实现,涵盖系统总体架构、FPGA硬件设计、上位机软件设计以及系统集成方案。系统由上位机控制软件(PC端)、FPGA控制核心和高压输出模块(144通道)三部分组成。FPGA硬件设计部分详细描述了Verilog代码实现,包括PWM生成模块、UART通信模块和温度监控模块。硬件设计说明中提及了FPGA选型、PWM生成方式、通信接口、高压输出模块和保护电路的设计要点。上位机软件采用Python编写,实现了设备连接、命令发送、序列控制等功能,并提供了一个图形用户界面(GUI)用于方便的操作和配置。 适合人群:具备一定硬件设计和编程基础的电子工程师、FPGA开发者及科研人员。 使用场景及目标:①适用于需要精确控制多通道电压输出的实验环境或工业应用场景;②帮助用户理解和掌握FPGA在复杂控制系统中的应用,包括PWM控制、UART通信及多通道信号处理;③为研究人员提供一个可扩展的平台,用于测试和验证不同的电压源控制算法和策略。 阅读建议:由于涉及硬件和软件两方面的内容,建议读者先熟悉FPGA基础知识和Verilog语言,同时具备一定的Python编程经验。在阅读过程中,应结合硬件电路图和代码注释,逐步理解系统的各个组成部分及其相互关系。此外,实际动手搭建和调试该系统将有助于加深对整个设计的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

赵卓不凡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值