OpenAI 对 ChatGPT 进行重大升级,图像生成功能即将迎来新的 4o 模型,并取代原本的 DALL·E。此次更新不仅提升了图像生成质量,还增强了对话内容和上传文件的融合能力,使 AI 生成的图像更加智能化和精准化。
4o 模型带来的革新
OpenAI 宣布,基于 4o 模型的 ChatGPT 在图像生成和处理方面实现了多项突破。
这包括更精确地理解指令、更强的上下文感知能力以及更优化的文本渲染效果。这意味着,用户可以更加精准地控制图像的细节,并在各种场景下获得更符合预期的视觉输出。
此外,4o 模型是全模态(Omnimodal)的,这意味着它可以同时处理文本、音频和图像,而不再需要多个独立模型进行信息传递。这种架构上的革新,不仅提高了生成速度,也降低了因多模型交互导致的错误。
此次更新将逐步向 Plus、Pro、Teams 和免费账户开放,而企业(Enterprise)和教育(Edu)客户的支持将在稍后推出。
更高质量的图像生成
4o 模型在多个方面提升了图像生成质量。例如,它可以更精准地生成图表、信息图、Logo以及社交媒体推广图形,并支持使用十六进制颜色代码。
由于文本渲染能力的增强,用户甚至可以设计名片或制作具有透明背景的图像,以便直接用于演示文稿或其他创作场景。
此外,该模型还支持基于模板修改图像。例如,用户可以上传客厅照片,让 AI 生成不同风格的室内设计方案。OpenAI 还展示了一个应用场景,即根据对话内容生成特定主题的图像,例如中央公园的鸟类图鉴或某个历史时代的可视化场景。
值得一提的是,OpenAI 采用开放标准 C2PA,对所有 AI 生成的图像进行溯源标记。这一技术被广泛用于验证照片的真实性,以减少虚假信息的传播。
潜在的风险与道德争议
随着 4o 模型的强大能力逐渐展现,一些风险也浮出水面。例如,新模型在生成图像文本方面的精准度,使得伪造票据变得前所未有的简单。
有社交媒体用户成功用 4o 生成了逼真的餐厅收据,其中甚至包括污渍和折痕,使其看上去极具真实性。
这引发了人们对欺诈风险的担忧。例如,不法分子可能利用 AI 生成的收据伪造不存在的开支,从而骗取报销。尽管 OpenAI 规定禁止 AI 被用于欺诈行为,但如何有效防止这一风险仍然是个难题。
OpenAI 回应
针对 AI 生成伪造收据的问题,OpenAI 发言人表示,所有由 ChatGPT 生成的图像都会包含元数据,以表明其来源。同时,公司会持续监测用户行为,确保其符合 OpenAI 的使用政策。
然而,OpenAI 也强调,AI 生成的假收据并不一定用于欺诈场景。例如,它可以用于学习财务知识,或为创作原创艺术和广告提供素材。
OpenAI CEO Sam Altman 也在社交平台上表示,公司希望赋予用户更大的创作自由,同时会关注社会的反馈,并适时调整策略。