爆火情侣竟不是真人!新版Midjourney效果炸裂,网友:太可怕了

点击上方“芋道源码”,选择“设为星标

管她前浪,还是后浪?

能浪的浪,才是好浪!

每天 10:33 更新文章,每天掉亿点点头发...

源码精品专栏

 

来源:量子位(QbitAI)


注意看,这张情侣照在网上转疯了:

caffe6c982e7681f7dc2adec54273f61.png

旧厂街风格,带着浓浓90年代氛围感,但是 ,他俩一夜爆火的原因,你可能想象不到——

这二位并不是真人! 而是由AI一键生成的!

(不论是乍眼看去或是放大细瞧,都会觉得是拿相机拍的真人吧!)

这就是Midjourney 最新V5版本解锁的逆天神技。

就连AI绘画最被诟病的 ,这次也完全能hold住了。

而且很多网友一开始不相信这是AI画的,于是他们亲自下场输入提示词来验证:

A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen —v 5 —s 250 —q 2.

一对年轻的中国情侣,穿着夹克和牛仔裤,坐在屋顶上,背景是20世纪90年代的北京,可以看到对面的建筑—v 5 —s 250 —q 2。

3b165b5641c4fc872cc08e0467dc4969.png

在自己体验了一把之后,不少网友这次真的直呼:

人类画师别活了。

把我吓坏了。

a5883bceb22819c9d77562731f4d353f.png f56f669da3a0e43b92e928c40880a239.png

逼真的不像话

90年代的中国情侣以假乱真,那么现代版的呢?

把提示词中的年代改成2023年:

abc9588f0115c2b2e6656cc44f290cd4.png

无论是时尚的破洞裤、潮流的发型,还是背景的楼宇环境,一下子都拉回到了现在。

还有这样的:

5b85f16ce80eca04123149ac3629012f.jpeg
△来自微博@谷大白话

甚至有人觉得人物的眼神,根据时代不同也在发生变化。

而且逼真程度也是骗过了不少网友:

49fd4fa409d9506ea5659f07245ce121.png

当然,“欧美爱情故事”也是不在话下:

0d9bc96310922a234c10c7d168a55969.png

当然,大家最关心的还是“手”画的怎么样。

于是,一位网友就专门加大难度来测试Midjourney V5的这项能力。

例如一张印度美人露手的全身像:

f3a1b451b16319e2617cc227a40c5027.png

妥妥是影楼大片级别了。

再生成竖大拇哥 的:

73ccd23ecc16b42f1212bc1c1cc241c5.png

不仅没有拉胯,甚至Midjourney能把镜头的聚焦感体现出来。

那么只生成手呢?

这一次,真的可以说是没让大家失望了:

60b79ca753155a305cd3524d80c56461.png

Midjourney这回可以说是惊艳众人了,不过也有网友好奇,另一位重量级选手Stable Diffusion表现又会如何?

这不,有位网友便用Stable Diffusion搞了个镜像:

3b65acca61c5a23387667550e337027e.png

效果似乎也不错?

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/ruoyi-vue-pro

  • 视频教程:https://doc.iocoder.cn/video/

效果为何如此炸裂

Midjourney时隔4个月的更新,为何会让效果一下拉高到如此“吓人”的程度?具体又更新了哪些东西呢?

整体来说,最明显的的当属以下三点更新了:

  • 细节更加逼真

  • 更多可以选择的风格

  • 告别不会画手

首先是细节部分,下图从左到右依次是V3、V4、V5生成的效果,可以说是越来越逼近照片效果了。

5579730c4e3ab5bc80fb2661be264340.png
△图源:arstechnica

不仅如此,在有面部特写时,各种肌肤纹理以及光影效果,比如说反射、眩光和阴影等,V5都能搞定。

d7bf66123ca78854ad70565aeb96a495.png

在Discord发布说明中,Midjourney还指出,相较于V4版本,V5版本会有更多的可以选择的风格 ,分辨率也提升了2倍

风格的话,可以从0~1000中选择,stylize 0=照片,stylize 1000=更艺术。

并且V5还会对提示词更加敏感 ,用更少更精简的文本生成更好的有效的图片。

更更更重要的是,这次升级,Midjourney可算是摆脱掉了“不会画手”标签,想要靠看手指数的多少来判别AI作画已经不管用了(Doge)。

值得一提的是,此前,已经有人通过 Stable Diffusion+ControlNet 解决了AI画手的问题。

不过,也有网友出来开杠,虽然手指数画对了,但仔细看细节还是能区分出的:

大拇指还是有点过长了。

cbffd6d21f5793d5aee025c429a28fcb.png19a8686df7608aaec1c6c65f9e1227b9.png

当然,除了上面这些比较明显的升级之外,Midjourney V5版本还更新了一些小细节。

一位机器学习博主特意列了张表格对V4、V5进行了对比。

caa14464557ad97c60dce88e11575bc1.png
△来自@Lars Nielsen

比如说,在最新的V5版本中,重复式、铺瓷砖式作画功能又回来了,在V4版本中,这项功能被官方禁止。

9e8c550dba499b91f5d5ddca6b488853.png

还有,Midjourney V5生成的尺寸也更加自由,像下面1:3、5:1这种窄长的图像就是V5生成的,甚至1:10的图像它也能生成(如果你想的话)。

反观V4版本,尺寸被限制在1:2~2:1之间。

66e9c1265da78582f815e6f179794848.png

嗯,这样的话,说不定之后的某个电影创作画面就是Midjourney V5生成的。

cb0484731ccbd229d844d18f36c2851e.png

此外,V5版本还可以手动调节图像权重,比如输入一张图像,可以手动输入数值来决定它影响最终生成图像的程度。

9ee006a8d979542e5c0196151f43ed2c.jpeg 3077b4bb7aa7ddcf8e826f0d20794ec5.jpeg

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

  • 项目地址:https://github.com/YunaiV/yudao-cloud

  • 视频教程:https://doc.iocoder.cn/video/

如何上手试玩

Midjourney目前在公测阶段,通过Discord的机器人指令,AI会根据提示词帮你生成4张你想要的图像。

535db6333c93a66ee1f555c73706cced.png

具体来说,加入测试后,在新手频道中,你可以通过**/image** 指令来输入提示词。

99d0f2ce97412baa8f5324318d8b788b.png

不过,现在想要玩上V5版本的Midjourney,得先充值成为付费用户才行。

06a19112f257f536753955d5124ca320.png

(充哪一档都可以)

在提示词中加入 —v 5 或者从/settings 中选择“V5”,就可以试玩这个最新模型啦~

就像这样:

e6d0ebc30454e06d4191879594447805.png

啊,对了,如果你不知道怎么写提示词,或许可以问问GPT-4。

b97a2d28512f9026cfd59c6351823d9f.png

参考链接:

[1]https://twitter.com/mranti/status/1637326003927396352 [2]https://twitter.com/heybarsee/status/1636766986809282561?s=46&t=6eepxw1G6XRQ7VO0ANjJWg [3]https://twitter.com/TheCartelDel/status/1636262759947210753 [4]https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/



欢迎加入我的知识星球,一起探讨架构,交流源码。加入方式,长按下方二维码噢

24235447b7e4cebcf0ad384754fc8ce0.png

已在知识星球更新源码解析如下:

5a2567cb4f1776397526b1325c5f9ce4.jpeg

6a64d8a376f7de660ef4964cf088d00a.jpeg

f473b039bcb87ae7bc1339fc517b1b0d.jpeg

788f492659d1322d4c699d917fa86eb0.jpeg

最近更新《芋道 SpringBoot 2.X 入门》系列,已经 101 余篇,覆盖了 MyBatis、Redis、MongoDB、ES、分库分表、读写分离、SpringMVC、Webflux、权限、WebSocket、Dubbo、RabbitMQ、RocketMQ、Kafka、性能测试等等内容。

提供近 3W 行代码的 SpringBoot 示例,以及超 4W 行代码的电商微服务项目。

获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

文章有帮助的话,在看,转发吧。
谢谢支持哟 (*^__^*)
具有多种最大功率点跟踪(MPPT)方法的光伏发电系统(P&O-增量法-人工神经网络-模糊逻辑控制-粒子群优化)之使用粒子群算法的最大功率点追踪(MPPT)(Simulink仿真实现)内容概要:本文介绍了一个涵盖多个科研领域的综合性MATLAB仿真资源集合,重点聚焦于光伏发电系统中基于粒子群优化(PSO)算法的最大功率点追踪(MPPT)技术的Simulink仿真实现。文档还列举了多种MPPT方法(如P&O、增量电导法、神经网络、模糊逻辑控制等),并展示了该团队在电力系统、智能优化算法、机器学习、路径规划、无人机控制、信号处理等多个方向的技术服务能力与代码实现案例。整体内容以科研仿真为核心,提供大量可复现的Matlab/Simulink模型和优化算法应用实例。; 适合人群:具备一定电力电子、自动控制或新能源背景,熟悉MATLAB/Simulink环境,从事科研或工程仿真的研究生、科研人员及技术人员。; 使用场景及目标:①学习并实现光伏系统中基于粒子群算法的MPPT控制策略;②掌握多种智能优化算法在电力系统与自动化领域的建模与仿真方法;③获取可用于论文复现、项目开发和技术攻关的高质量仿真资源。; 阅读建议:建议结合提供的网盘资料,按照研究方向选取对应模块进行实践,重点关注Simulink模型结构与算法代码逻辑的结合,注重从原理到仿真实现的全过程理解,提升科研建模能力。
热成像人物检测数据集 一、基础信息 数据集名称:热成像人物检测数据集 图片数量: 训练集:424张图片 验证集:121张图片 测试集:61张图片 总计:606张热成像图片 分类类别: - 热成像人物:在热成像图像中的人物实例 - 非热成像人物:在非热成像或普通图像中的人物实例,用于对比分析 标注格式: YOLO格式,包含边界框和类别标签,适用于目标检测任务。数据来源于热成像和视觉图像,覆盖多种场景条件。 二、适用场景 热成像监控与安防系统开发: 数据集支持目标检测任务,帮助构建能够在低光、夜间或恶劣环境下自动检测和定位人物的AI模型,提升监控系统的可靠性和实时响应能力。 红外视觉应用研发: 集成至红外摄像头或热成像设备中,实现实时人物检测功能,应用于安防、军事、救援和工业检测等领域。 学术研究与创新: 支持计算机视觉与热成像技术的交叉研究,助力开发新算法用于人物行为分析或环境适应型检测模型。 教育与培训: 可用于高校或培训机构,作为学习热成像人物检测和AI模型开发的教学资源,提升实践技能。 三、数据集优势 精准标注与多样性: 每张图片均由专业标注员标注,确保边界框定位准确,类别分类清晰。包含热成像和非热成像类别,提供对比数据,增强模型的泛化能力和鲁棒性。 场景实用性强: 数据覆盖多种环境条件,如不同光照和天气,模拟真实世界应用,适用于复杂场景下的人物检测任务。 任务适配性高: YOLO标注格式兼容主流深度学习框架(如YOLOv5、YOLOv8等),可直接加载使用,支持快速模型开发和评估。 应用价值突出: 专注于热成像人物检测,在安防、监控和特殊环境检测中具有重要价值,支持早期预警和高效决策。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值