
最新人工智能消息
-
谷歌的新 Gemini 模型 支持多达 1M的Token,可以分析长达一小时的视频
-
1M Token可能意味着分析700,000 个单词、 30,000 行代码或11 小时的音频、总结、改写和引用内容。
-
Comment:google公司有夸大的传统,所以真实效果需要上手体验才知道;
-
-
OpenAI 推出了 Sora,一个出色的文本转视频模型。但目前仍受到限制:Sora 创造了令人印象深刻的文本到视频结果,但风险意味着谨慎推出。
-
时长、连贯性效果上都有突破,冲击最大的当然还是视频创意领域。
-
Comment:问题还是存在的,比如:遵循物理规律,理解时序、空间的因果关系,多实体的关系定位,精确的prompt执行等,技术报告还是没有涉及到模型和训练细节
-
-
Bulletin 是一款新的人工智能新闻聚合阅读器,可以总结故事,避免标题党骗点击
AI Tools
-
theGist:企业级的统一的 AI 工作空间.
https://www.thegist.ai/ -
Augie Storyteller:一种生成自定义动画视频和故事的工具。
-
Headshot Pro:在几分钟内获得专业的头部照片。
https://www.headshotpro.com/ -
DupDub:自动视频翻译的人工智能配音工具
https://www.dupdub.com/

谷歌的Gemini模型支持大量Token,可处理长时间视频分析;OpenAI的Sora展示了文本转视频能力,但存在局限。同时,AI工具如Bulletin聚合新闻和AugieStoryteller生成动画视频,AI配音工具DupDub提供自动翻译。然而,技术挑战如物理规律理解和多实体关系识别仍待解决。
9487

被折叠的 条评论
为什么被折叠?



