我直接出手！开源最强数字人Hallo2，拿下！

最新推荐文章于 2025-04-09 11:16:00 发布

glenji

最新推荐文章于 2025-04-09 11:16:00 发布

阅读量458

点赞数 4

分类专栏： AI 文章标签：人工智能音视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/jxw_glen/article/details/144080122

版权

AI 专栏收录该内容

67 篇文章

订阅专栏

大家好，我是立志替大家出手的AI区（说出手，就出手）UP主Glen。

在这个AI的时代，一张静态的照片都能被AI赋予生命，仿佛被施了魔法一般。今天呢，我要给大家分享一个由复旦大学、百度公司、苏黎世联邦理工学院和南京大学联手打造的AI对口型肖像图像动画技术——Hallo2。

这个技术，就像是给静态图片打了一针“动起来”的兴奋剂，让它们根据你的语音音频，生成一个逼真且动态的视频。你只需要提供一张图片和你的声音，Hallo就能给你变出一个会说话的“自己”，而且……

今天还是老规矩，直接替大家出手，分享一个Hallo2一键整合包。

Hallo2简介

在视频游戏、虚拟现实、电影电视制作、社交媒体和数字营销等领域，肖像图像动画技术一直是个大热门。但是，传统的方法是通过参数化模型来生成说话的人像，这就像是让一个机器人去模仿人类的表情和动作，总是感觉差那么点意思。

而Hallo2的出现，可能会改变这一切！Hallo这个端到端模型，就像是个魔术师，直接从声音驱动生成视频，无需复杂的参数化中间表示和额外的动作输入。它采用了分层音频驱动的视觉合成模块，通过分层交叉注意力操作，让嘴唇、面部和头部的动作更加自然丰富。

技术架构：

Hallo的网络架构整合了各种高科技元素，包括基于扩散的生成模型、基于UNet的去噪器、时间对齐技术和参考网络，这些都是为了让动画的质量和真实感更上一层楼。

全局运动可控性：Hallo利用分层面部特征注意力机制，能针对性地控制口型、表情和动作的运动强度，大幅提升人脸动画生成的可控性。
应用前景：从影视制作到游戏与虚拟现实，再到教育领域，Hallo都能大显身手。它不仅能提高制作效率，还能实现更高质量的动画效果，增强用户的沉浸感和参与感。

离线懒人包来了

老规矩，大家自行在本地部署比较麻烦，（无所谓，我会出手.jpg），我已经为大家制作好了一款一键整合包了，下载到本地解压即用。

大家下载解压到本地后，双击“一键启动.exe”，项目会自动打开浏览器运行。如果没有自动打开浏览器，请自行复制网址“http://127.0.0.1:7860/”在浏览器打开，系统就会自动运行并打开一个简单的用户界面。

使用教程：

上传素材图片，上传素材音频，可以自由调节参数，点击“立即运行”按钮。稍等片刻，该工具会根据我们提供的素材，来生成数字人视频啦~

注意事项：

①显卡要求：建议使用至少10GB显存的英伟达显卡，而且建议把上传的音频拆分到3秒一下，以减少生成时间。

②软件路径、图片和视频文件的名称和路径都不能包含中文，不然可能会出错。另外，计算机系统的用户名也不要设置成中文，不然也可能会出现问题。

③系统要求：支持Windows 10和Windows 11。

今天就聊到这了，我是Glen，感谢你看我的内容，欢迎大家继续支持我，请点赞、收藏、分享三连走一波吧~

关注微信公众号Glen，后台回复关键词【Hallo2下载】免费获得整合包。

我是Glen，原鹅厂、字节高级产品经理，现AI公司创始人。让一部分人，看见AI并连接。分享人工智能、互联网、商业、职场等内容，管理精力，提升认知。种一棵树最好的时机是十年前，其次是现在！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。