OpenAI推出视觉能力的GPT-4 Turbo模型；谷歌推出 Gemini 1.5 Pro

go2coding

于 2024-04-10 09:06:06 发布

阅读量1.3k

点赞数 21

分类专栏： AI日报文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40425640/article/details/137580887

版权

在这里插入图片描述

🦉 AI新闻

🚀 OpenAI推出视觉能力的GPT-4 Turbo模型

摘要：OpenAI最新发布的GPT-4 Turbo with Vision模型，现通过API向开发者广泛提供。该版本在保持之前128,000个token的窗口大小和更新至2023年12月的知识库基础上，最大的创新是引入了视觉理解能力。这一特性使得开发者无需分别调用文本和图像信息处理模型，简化了开发流程，并拓展了应用场景。包括编程辅助、饮食营养分析、将草图转化为网站等多种应用案例，显示了其广泛的潜能。目前该模型尚未集成至ChatGPT或向公众开放，但OpenAI暗示不久将会实现。

🚀 谷歌推出 Gemini 1.5 Pro，并增加数字水印功能

摘要：谷歌在最近的Google Next大会上宣布，通过其AI应用平台Vertex AI向公众开放了Gemini 1.5 Pro的公共预览版。此更新旨在帮助用户更高效地处理音频内容，例如通过上传音频文件来进行分析或总结。Gemini 1.5 Pro在性能上超越了自家的大型模型Gemini Ultra，尽管Gemini Ultra能够理解更长的指令，但处理速度较慢。除此之外，文生图模型Imagen 2也得到了更新，加入了图片修复和扩充功能，并为所有图片提供了数字水印功能“SynthID”，从而提升了内容的安全性。谷歌计划在公开预览中尝试将AI响应与谷

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

go2coding 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。