基于世界模型的实时互动游戏引擎 Mirage:可自然语言创造可互动游戏;阿里开源 OmniAvatar:音频生成全身数字人视频丨日报

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@赵怡岭、@鲍勃

01社区项目推荐

1、基于世界模型的实时互动游戏引擎预览版 Mirage:可以使用自然语言创造可互动的游戏场景

Mirage 是一个基于世界模型的实时互动游戏引擎预览版,具备模拟 GTA、Forza Horizon 等游戏的能力,让你可以使用自然语言创造可互动的游戏场景!

  • 用户生成内容(UGC):玩家不仅仅是重玩预设的游戏——玩家可以编辑、扩展并创造全新的世界;

  • 丰富的视觉效果与控制:支持类似 GTA 或 Forza 风格的复杂沉浸式体验,超越了 Minecraft 或 DOOM 那种方块式的简易风格;

  • 长时游戏玩法:支持持续 5 到 10 分钟甚至更长时间的游戏,而不仅仅是几秒钟的短暂体验。

博客: https://blog.dynamicslab.ai/

体验: https://demo.dynamicslab.ai/drifthttps://demo.dynamicslab.ai/chaos

X: https://x.com/DynamicsLab_AI/status/1940459348423332198

02有话题的技术

1、阿里联合夸克开源 OmniAvatar:支持根据输入的音频和文本提示生成全身数字人视频

OmniAvatar 是浙江大学和阿里巴巴集团共同推出的音频驱动全身视频生成模型。

可根据输入的音频和文本提示,生成自然、逼真的全身动画视频,人物动作与音频完美同步,表情丰富。

模型基于像素级多级音频嵌入策略和 LoRA 训练方法,有效提升唇部同步精度和全身动作的自然度,支持人物与物体交互、背景控制和情绪控制等功能,广泛应用在播客、互动视频、虚拟场景等多种领域。

  • 自然唇部同步:能生成与音频完美同步的唇部动作,在复杂场景下保持高度准确性;

  • 全身动画生成:支持生成自然流畅的全身动作,让动画更加生动逼真;

  • 文本控制:基于文本提示精确控制视频内容,包括人物动作、背景、情绪等,实现高度定制化的视频生成;

  • 人物与物体交互:支持生成人物与周围物体互动的场景,如拿起物品、操作设备等,拓展了

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值