阿里开源Wan2.1:视频生成新标杆,中文字效+高质量视频一键生成!

部署运行你感兴趣的模型镜像

 近期,阿里云通义万象团队发布了视频生成大模型Wan2.1,很快冲到了HuggingFace榜的第4位。Wan2.1是阿里云开源的AI视频生成大模型,具备强大的视觉生成能力。Wan2.1支持文生视频和图生视频任务,包含两种尺寸的模型,14B参数的专业版擅长复杂运动生成和物理建模,性能卓越;1.3B参数的极速版能在消费级显卡上运行,显存需求低,适合二次开发和学术研究。



Stars 数6257
Forks 数464

 主要特点

  • 卓越性能:Wan2.1在多个基准测试中持续超越现有开源模型及顶尖商业解决方案。

  • 支持消费级GPU:T2V-1.3B模型仅需8.19GB显存,兼容几乎所有消费级GPU。在RTX 4090上,约4分钟即可生成一段5秒480P视频(未采用量化等优化技术),其性能甚至可与某些闭源模型媲美。

  • 多任务处理:Wan2.1在文本转视频、图像转视频、视频编辑、文本转图像及视频转音频等任务上表现卓越,推动视频生成领域向前发展。

  • 视觉文本生成:Wan2.1是首个能生成中英双语文本的视频模型,具备强大的文本生成能力,增强了其实用性。

  • 强大的视频VAE:Wan-VAE在效率与性能上表现卓越,能编码解码任意长度的1080P视频,同时保留时间信息,是视频与图像生成的理想基础。

官网:https://wanxai.com/?utm_source=ai-bot.cn

GitHub:https://github.com/Wan-Video/Wan2.1

HuggingFace模型库:https://huggingface.co/Wan-AI

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值