近期,OpenAI 上线了 GPT-4o 模型的生图功能,这个消息也是刷爆了朋友圈和各大社媒平台。
特别是在设计圈,一片“哀鸿遍野”,GPT-4o 模型的上线不仅改变了传统设计流程,更可能颠覆了如今主流的AI生图工作流。
但其实,GPT-4o在生图领域的应用场景,并没有那么完美。毕竟,有许多博主/媒体为了流量,非常努力的渲染焦虑罢了。
有技术大佬扒出,其实GPT-4o的图像生成功能采用了“自回归模型 ”,与传统的“扩散模型”有所不同。GPT-4o生图主要依赖自回归模型,能够通过语言模型结合图像生成。它生成的图像通常非常准确地与文本描述匹配。扩散模型则通过噪声的添加和去噪的过程生成图像,能够生成更高质量、细节丰富的图像,但生成过程相对较慢。
GPT-4o的缺点也很显著:
1、生成速度慢
GPT-4o目前就算充值了20美元的会员,生成速度也很慢,这时肯定会有人说,这是因为用户量庞大,才导致生成慢。但其实是由于生成高质量图像需要大量计算资源,GPT-4o的生成速度可能较慢,尤其在高负载情况下,生成一张图片可能耗时较长,非常影响体验。
2、图像裁剪错乱
在生成图像时,GPT-4o 会出现裁剪不当的情况,而且无法准确的控制图像尺寸生成。
3、模型幻觉问题
GPT-4o 在生成图像时,可能会出现与现实不符的细节,即模型幻觉(大语言模型的通病)。这种情况可能导致图像中出现不真实或不一致的元素,影响生成内容的可信度。
4、高结合问题
处理包含多个元素的复杂场景时,GPT-4o可能在将不同对象和特征紧密结合方面遇到困难,导致生成的图像缺乏协调性和一致性。
5、密集信息问题
当图像包含大量密集信息时,GPT-4o可能难以准确呈现所有细节,导致部分内容模糊或缺失,影响图像的完整性和可读性。
6、原始图像变形问题
在使用GPT-4o时,想要生成好的效果就一定要垫图,GPT-4o会对原始图像进行修改,比如说被吹爆的抠图,仔细看你会发现,人像有变化。
7、数据安全问题
GPT-4o 在生成图像过程中可能涉及使用大量数据,包括用户提供的参考图像。这可能引发数据隐私和安全问题,特别是当生成内容包含敏感信息时。
8、版权问题
有许多IP角色、人物的生成会有限制,会出现无法生成的情况,虽然这也是对版权和原创性的保护,但用起来总是不那么顺畅。
看到这么多问题,是不是突然觉得GPT-4o被过度神话了。
虽然但是,我们也不是一定要贬低GPT-4o,使用过的都知道,它的文本渲染能力非常强,毕竟有强大的大语言模型的数据库,能够生成多种文字,甚至中文;简单的提示词也可以快速理解,真正实现了“让大象转个身”的设计指示;另外还有多样的风格表达,风格化是AI最快速的传播功能之一,其中吉卜力风格直接再一次掀起流行趋势。
有没有发现,GPT-4o爆火主要是因为图像领域的应用场景,让更多人对设计这个行业产生担忧,也让许多品牌企业老板看到了提高效率工作的一面。无论是从24年大模型的发展还是现如今AI工具的泛滥。由此可见,市场接纳度才是检验AI产品是否优秀的唯一标准。
对于目前许多设计师来说,GPT-4o通过对话就能解决复杂的基础设计需求,确实看起来提升了很大效率。现如今,很多AI工具其实都能实现GPT-4o图像应用场景。神采AI作为一个国产AI工具,它的图像创作能力已经可以解决一大部分的行业痛点,让创作者实现高效率完成工作目标,减少枯燥无味的基础工作。
一、图像设计领域
1) 风格转绘
就是将一种特定的艺术风格应用到图像中,例如动漫转真人,线稿上色,照片变插画等等,都属于风格化的一种转换。这些都能通过神采AI的「草图渲染」功能去完成,以下就是一些成品展示。
2) 风格迁移
与转绘是一个意思,但其实就是自定义风格,比如说我想把A图生成B图风格效果,但要保持A图结构不变。这就可以用到神采AI的「创意融合」功能,直接一键迁移风格,无论是logo、室内、建筑设计等等,都能通过该功能实现。
3) 角色设计
平面线稿图一键生成3D角色效果,无论是企业形象设计,还是想自定义制作潮玩产品,同样也是使用神采AI的「草图渲染」功能实现。
4) 草图转绘
将简单的草图或素描转化为精细的绘画作品,俗称给线稿上色,这是AIGC出现时,最早实现的应用方向,可帮助插画师提高填色灵感等。神采AI不仅可以转成绘画版,还能一键生成真实效果图,应用领域可以延伸到建筑、室内、景观、营销、游戏设计里。
5) 模特换装
在AI技术发展时,电商领域是最迅速使用AI工具产品的。往往应用在AI模特生成和产品背景生成等,可节约拍摄成本。
神采AI的「AI超模」功能可以实现让人台图直接生成模特试穿效果,真人穿搭一键换脸效果。
「产品效果生成器」可保持背景不变,更换产品背景。
「涂抹替换」功能可实现让鞋子、饰品等,一键生成模特试穿效果。
6) 室内设计
室内设计领域目前很多用AI来做软装灵感参考和建筑外立面修改等,因此神采AI开发了「空房间装修」和「旧建筑翻新」的功能。除此之外,还可以通过「场景转换器」切换一年四季的外景效果展示。
7) 字体设计
字体设计是日常我们看到最多的创意设计之一,无论是线上线下广告,艺术字体的展现总是能让人眼前一亮,而在某红书上也有很多人分享过艺术字体设计效果,以下这些都是通过神采AI的「文字效果」「创意融合」「草图渲染」等功能去实现生成的。
二、图像编辑
图像编辑功能就像是一个在线PS一样,例如抠图、去水印这种简单的AI技术,已经帮助许多企业辅助设计工作。而这些基础功能,大多拼的是技术能力。
1、抠图
李白人工智能实验室研发的产品神采AI,采用的正是团队自有算法模型,该算法模型在Alpha Matting Evaluation Website 斩获全球第二,全国第一的优异成绩。能精确识别商品轮廓,批量处理图片,快速制作大量白底图。并且完全不会改变原图效果。
2、ai扩图
利用AI技术对原有图像进行边缘延伸或场景拓展,生成一个连贯且符合原始风格的新区域。最常用的便是把一个9:16的竖图直接扩展成16:9的图,完全看不出痕迹。应用范围可以是PPT背景图片生成、海报设计、壁纸等等。
3、高清放大
把模糊的旧照片一键生成高清晰图像,改善图像的清晰度和色彩。
4、局部重绘
指在图像中选择特定区域进行重新绘制或修复,通过AI技术对该区域进行细节的重构、增强或改变,从而改善图像的视觉效果或替换不需要的元素,同时保持整体画面的连贯性。
5、矢量图转换
在设计工作中,各种图片格式的转换非常重要,神AI不仅仅只有AI生成功能,还提供一些设计材料生成,「矢量图转换器」可以将JPEG和PNG图转换为SVG格式的矢量文件,最重要的是会自动生成可用的分层文件。
总之在AI时代下,只会有越来越实用的AI工具,无论怎么发展和判断,AIGC将会是未来主流的发展趋势。企业和品牌方只有去选择利于自己的AI工具,能高效完成落地应用才是检验AI实力的最佳标准。