谷歌近日为其Gemini人工智能助手推出了两项重要新功能:Canvas协作工作空间和Audio Overviews音频概览,进一步提升了其AI助手的实用性和用户体验。
Canvas:互动式文档协作与创作
Canvas为用户提供了一个互动式工作空间,允许用户与AI共同创建文档和代码。该功能支持实时显示修改,并通过集成的聊天界面便于用户讨论改动。
特别值得一提的是,Canvas可以即时预览HTML和React代码,完成的文档可以直接导出到Google Docs。这一功能与去年秋季ChatGPT推出的同名功能有些相似。
MP4
Audio Overviews:将文字内容转化为播客音频
Audio Overviews功能允许用户将文档、演示文稿和研究报告等书面内容转化为类似播客的对话形式,由两位AI主持人进行分析与讨论。
谷歌通过将其更新后的深度研究功能的输出转化为AI音频播客,展示了这一技术。最初,这些音频摘要出现在NotebookLM平台上。值得注意的是,与其他AI生成内容一样,这些音频可能包含不准确信息,用户在使用时应保持谨慎。
目前,Audio Overviews功能仅支持英语,用户可通过网络和移动平台访问,并能下载和分享生成的音频文件。
Gemini生态系统持续扩展:新功能与优化
自今年年初以来,谷歌积极拓展其Gemini生态系统,最近的更新包括:
-
Gemini Live新增视频和屏幕共享支持,首先在三星Galaxy S24/S25和Pixel 9 设备上推出
-
谷歌计划用Gemini取代Google Assistant,成为Android的默认AI助手
-
推出了三种新的模型变体:Gemini 2.0 Flash(基础模型)、Flash Lite(经济高效版)和2.0 Pro(具有扩展上下文处理能力)
-
在欧盟、瑞士和英国以外地区,Gemini现可访问用户的Google搜索历史记录,提供更具情境的响应
-
平台新增生成和编辑图像及理解YouTube视频的原生多模式功能
据谷歌官方透露,Canvas和Audio Overviews功能现已面向全球Gemini和Gemini Advanced用户开放。