腾讯混元语音数字人模型开源:一张照片+一段音频即可生成动态视频

腾讯混元语音数字人模型开源:一张照片+一段音频即可生成动态视频

【免费下载链接】HunyuanVideo-Avatar HunyuanVideo-Avatar:基于多模态扩散Transformer的音频驱动人像动画模型,支持生成高动态、情感可控的多角色对话视频。输入任意风格头像图片与音频,即可生成逼真自然的动态视频,适用于电商、直播、社交媒体内容创作等场景 【免费下载链接】HunyuanVideo-Avatar 项目地址: https://ai.gitcode.com/tencent_hunyuan/HunyuanVideo-Avatar

2025年5月28日,腾讯混元正式发布并开源语音数字人模型HunyuanVideo-Avatar,这项由腾讯混元视频大模型与腾讯音乐天琴实验室MuseV技术联合打造的AI能力,彻底颠覆了传统视频创作模式。用户仅需上传一张人物图像和一段音频,即可让静态画面中的角色自然开口说话、唱歌甚至表演,实现从单张图片到动态视频的跨越式转化。

作为一款全场景适配的视频生成工具,HunyuanVideo-Avatar具备强大的环境理解与情感迁移能力。当用户输入"沙滩吉他手+抒情音乐"的组合时,模型能自动解析场景要素(海边环境、吉他乐器)与音频情感(抒情基调),生成人物弹唱的连贯画面;若上传"森林篝火旁的女孩+歌曲",系统则会同步渲染火焰跳动的动态背景与人物演唱时的细腻表情,实现主体与场景的自然融合。这种端到端的智能创作流程,将原本需要专业团队数天完成的视频制作压缩至分钟级。

在商业应用领域,该模型已展现出多元价值。腾讯音乐旗下QQ音乐的"AI力宏"虚拟歌手项目中,通过实时驱动技术让AI形象随歌曲节奏精准对口型;酷狗音乐的长音频绘本功能则赋予虚拟角色讲故事的能力,使儿童内容更具互动性;全民K歌更是将创作权下放给普通用户,支持上传个人照片生成专属MV。这些场景验证了技术在降低内容生产成本、提升创作效率方面的核心优势,尤其为电商广告、知识付费、短视频创作等行业提供了轻量化解决方案。

技术层面,HunyuanVideo-Avatar构建了多维度的创新体系。其核心的多模态扩散Transformer(MM-DiT)架构,通过角色图像注入模块确保生成视频中人物特征的一致性;音频情感模块能从语音中提取喜怒哀乐等情绪信号,转化为匹配的面部表情与肢体动作;而面部感知音频适配器则通过人脸掩码技术,实现多人对话场景中各角色语音的精准分离与驱动。这些技术突破使得模型在主体一致性、音画同步精度上超越现有开源方案,达到业内顶尖水平。

值得关注的是,该模型突破性地支持头肩、半身、全身等多景别生成,并覆盖赛博朋克、2D动漫、中国水墨画等多元风格,甚至可驱动动物、机器人等非人类角色。在多人互动场景中,无论是相声表演的你来我往,还是合唱时的声部配合,模型都能精准控制每个角色的唇形、表情与动作同步,展现出强大的复杂场景处理能力。这种全场景适配性,使其区别于传统仅支持头部驱动的数字人技术,大幅拓展了应用边界。

目前,HunyuanVideo-Avatar的单主体生成能力已正式开源,用户可通过腾讯混元官网(PC端)体验,支持14秒以内音频的视频生成。项目代码托管于Gitcode平台(仓库地址:https://gitcode.com/tencent_hunyuan/HunyuanVideo-Avatar),技术团队计划逐步开放更多高级功能。这一开源举措不仅为开发者提供了研究数字人生成技术的优质样本,更有望推动AIGC视频创作生态的标准化发展,让更多创作者享受到AI技术带来的创作自由。

随着技术迭代,HunyuanVideo-Avatar未来将进一步优化动态背景生成精度与长视频连贯性,同时拓展多语言支持与实时交互能力。这场由腾讯引领的视频生成技术革新,正逐步瓦解专业创作与大众表达之间的技术壁垒,预示着"人人都是视频导演"的内容生产新纪元已悄然开启。

【免费下载链接】HunyuanVideo-Avatar HunyuanVideo-Avatar:基于多模态扩散Transformer的音频驱动人像动画模型,支持生成高动态、情感可控的多角色对话视频。输入任意风格头像图片与音频,即可生成逼真自然的动态视频,适用于电商、直播、社交媒体内容创作等场景 【免费下载链接】HunyuanVideo-Avatar 项目地址: https://ai.gitcode.com/tencent_hunyuan/HunyuanVideo-Avatar

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值