开年炸裂-Sora/Gemini

已于 2024-02-17 16:07:18 修改 · 950 阅读

·

7

·

文章标签：

#AIGC #SORA #Gemini #AI

于 2024-02-17 16:01:12 首次发布

谷歌的Gemini模型支持大量Token，可处理长时间视频分析；OpenAI的Sora展示了文本转视频能力，但存在局限。同时，AI工具如Bulletin聚合新闻和AugieStoryteller生成动画视频，AI配音工具DupDub提供自动翻译。然而，技术挑战如物理规律理解和多实体关系识别仍待解决。

部署运行你感兴趣的模型镜像

最新人工智能消息

谷歌的新 Gemini 模型支持多达 1M的Token，可以分析长达一小时的视频
- 1M Token可能意味着分析700,000 个单词、 30,000 行代码或11 小时的音频、总结、改写和引用内容。
- Comment：google公司有夸大的传统，所以真实效果需要上手体验才知道；
OpenAI 推出了 Sora，一个出色的文本转视频模型。但目前仍受到限制：Sora 创造了令人印象深刻的文本到视频结果，但风险意味着谨慎推出。
- 时长、连贯性效果上都有突破，冲击最大的当然还是视频创意领域。
- Comment：问题还是存在的，比如：遵循物理规律，理解时序、空间的因果关系，多实体的关系定位，精确的prompt执行等，技术报告还是没有涉及到模型和训练细节
Bulletin 是一款新的人工智能新闻聚合阅读器，可以总结故事，避免标题党骗点击

AI Tools

theGist：企业级的统一的 AI 工作空间.
https://www.thegist.ai/
Augie Storyteller：一种生成自定义动画视频和故事的工具。
Headshot Pro：在几分钟内获得专业的头部照片。
https://www.headshotpro.com/
DupDub：自动视频翻译的人工智能配音工具
https://www.dupdub.com/

您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。