ChatGPT 不断发展。 ChatGPT 的开发商 OpenAI 于 2024 年 5 月 13 日公布了 ChatGPT 的新型号“GPT-4o(GPT-4o/Omni)”,在 Twitter(旧 Twitter)上引起热议。
现在,ChatGPT 已成为一种新模型“GPT-4o”,我们将介绍发生了什么变化、现在可以做什么以及如何使用它。
ChatGPT 的 GPT-4o (GPT4O/Omni) 是什么?与其他一代人工智能相比,性能如何?如何阅读?
“GPT-4o(GPT-4O/Omni”)是生成式AI ChatGPT的最新模型。官方名称和名称是“GPT-4O”,但也读作“GPT-4O”。
最初,ChatGPT 是作为基于文本的生成人工智能而开发的。最初的规范是,如果您以文本形式提出问题或请求某些内容,它将以与您的问题或请求相对应的文本进行响应。
然而,当ChatGPT模型从“GPT-3”进化到“GPT-4”时,可以输入文本以外的内容。例如,它现在可以读取图像并以文本形式输出图像的含义。除了“文本→文本”之外还能够执行“图像→文本”等操作的属性称为“多模态”。
在“GPT-4”的早期模型中,这种“多模态”功能仅向公众开放,并且可以与“图像→文本”一起使用。然而,通过这次更新,“GPT-4o”启用了“视频→文本”、“音频→文本”和“音频→音频”等各种输入/输出格式,并且具有更加“多模态”的性质。 。
“Omni”意味着全方位,它清楚地表达了多模式性能的改进和多种语言能力的提高。
此外,自 GPT-4 的初始模型以来,还进行了各种性能改进。下面是 OpenAI 官方公布的性能图表,将其与各种竞争 AI 进行比较。