OpenAI放大招！GPT4o一句话生图，支持中文！

最新推荐文章于 2025-07-09 19:42:58 发布

转载最新推荐文章于 2025-07-09 19:42:58 发布 · 122 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzA5NzgzODI5NA==&mid=2454102392&idx=2&sn=42af596a839369194efa0a0963b82162&chksm=8639363f5261d9a3c91890f66757cff50b088802067a915b79d158337af884e36439bd49a623&scene=126&sessionid=0

文章标签：

一水发自凹非寺
量子位 | 公众号 QbitAI

OpenAI全量开放GPT-4o图像生成能力，这回免费用户第一时间上车！

即日起在ChatGPT和Sora中，向所有Plus、Pro、Team和免费用户推出。

一夜之间，各种实测结果刷屏。最惊艳的莫过于对文本的处理能力。

比如，4o可以100%还原文字内容，且指定文字摆放位置。

男人右手举着“a few”，左手举着“words”

还能像连续剧一样，一边准确生成文字，一边变换人物动作。

仔细对比两张图，第一张白板中的男人倒影和第二张图也对应上了。

昨晚OpenAI突然宣布要开个小直播发布，这回奥特曼出现了（前情：GPT-4.5发布时他由于带娃没来）。

直播中展示了各种玩法，比如制作梗图、文本渲染、多轮交互生成和指令遵循等。

直接现场咔嚓一张自拍，然后立马转成动漫风格。

顺带官方玩梗制作meme图，要求在图片中添加“feel the agi”。（没错，生成时还知道将小写换成更符合的大写）

现在，打开ChatGPT，即可尝试这些能力。

实测生成速度很快（大约十几秒一张），但普通用户每天仅有3次体验机会。

API预计将在未来几周内逐步推出。

这波主打一个美观又实用

我们终于迈向了这种真正集成的多模态模型。

按照官方介绍，作为多模态模型的4o现在终于补齐了一块重要拼图——图片生成。

而且主打一个美观和实用两手抓。

话不多说，我们直接来看其能力升级的具体表现。

各项能力大升级

首先，OpenAI表示4o现在能精确融合符号和图片了。

比如直接给一段文字，然后生成一张制作精美的菜单：

而且支持在多轮对话中逐步调整图片内容和风格。

类似下面这样，提供一张猫猫原图，然后一步步创建一个游戏角色：

此外还非常注重细节，官方称4o可以处理多达10-20个不同的物体，而其他模型一般在处理5-8个物体时就会遇到困难。

除了上述，4o在生成真实图像方面也表现出色。

连现实版“照猫画虎”也有了(doge）：

网友实测ing

看完官方宣传效果，网友们也赶紧来了一波实测~

经典梗图第一时间申请出战，画面还真毫无违和感hhh。

甚至，复现同款书写图也是不在话下：

One More Thing

话说最近这两天也过于热闹了，DeepSeek、OpenAI和谷歌几乎同台开战。

值得一提的是，昨晚11点（北京时间）OpenAI突然宣布将有小发布，而DeepSeek刚刚发布了DeepSeek-v3-0324的官方技术报告。

不知道是不是被DS逼出来的新发布呢？（doge）

参考链接：
[1]https://openai.com/index/introducing-4o-image-generation/
[2]https://x.com/chatgpt21/status/1904683763914674208

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。