🦉 AI新闻
🚀 OpenAI推出视觉能力的GPT-4 Turbo模型
摘要:OpenAI最新发布的GPT-4 Turbo with Vision模型,现通过API向开发者广泛提供。该版本在保持之前128,000个token的窗口大小和更新至2023年12月的知识库基础上,最大的创新是引入了视觉理解能力。这一特性使得开发者无需分别调用文本和图像信息处理模型,简化了开发流程,并拓展了应用场景。包括编程辅助、饮食营养分析、将草图转化为网站等多种应用案例,显示了其广泛的潜能。目前该模型尚未集成至ChatGPT或向公众开放,但OpenAI暗示不久将会实现。
🚀 谷歌推出 Gemini 1.5 Pro,并增加数字水印功能
摘要:谷歌在最近的Google Next大会上宣布,通过其AI应用平台Vertex AI向公众开放了Gemini 1.5 Pro的公共预览版。此更新旨在帮助用户更高效地处理音频内容,例如通过上传音频文件来进行分析或总结。Gemini 1.5 Pro在性能上超越了自家的大型模型Gemini Ultra,尽管Gemini Ultra能够理解更长的指令,但处理速度较慢。除此之外,文生图模型Imagen 2也得到了更新,加入了图片修复和扩充功能,并为所有图片提供了数字水印功能“SynthID”,从而提升了内容的安全性。谷歌计划在公开预览中尝试将AI响应与谷