世界模型
文章平均质量分 88
AI生成未来
领先的AIGC和具身智能、大模型技术交流社区,关注LLM、CV、深度学习、生成式等人工智能领域前沿技术。更多精彩内容,请关注公众号:AI生成未来
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《黑客帝国》雏形已现?腾讯造出“可对话游戏宇宙”,实时生成、任意交互,世界为你改变!
Hunyuan-GameCraft-2提出了一种指令驱动的交互式游戏世界模型,通过集成文本、键盘和鼠标信号实现语义化交互控制。该模型采用14B参数的MoE架构,结合自回归蒸馏与随机化长视频微调技术,支持高效稳定的长时序视频生成。创新性地定义了交互式视频数据标准,并开发了自动化数据构建管道。实验表明,模型在InterBench基准上取得SOTA性能,能以16FPS实时生成高质量交互视频,显著提升了动作有效性(触发率0.96+)、因果连贯性和物理合理性。原创 2025-12-02 13:34:31 · 637 阅读 · 0 评论 -
打破次元壁!港大和达摩院联合发布头号玩家PlayerOne模型:世界首款“自我中心”模拟器!
香港大学与阿里达摩院联合推出PlayerOne模型,实现真实世界的第一人称动态模拟。该系统通过外置摄像头捕捉用户动作(如手势、头部转动),将其无缝融入由单张图像构建的虚拟场景,支持无限制交互与AAA级画质体验。关键技术包括:部件解耦的动作编码(区分头/手/躯干)、4D场景点云重建确保一致性,以及两阶段训练策略解决数据稀缺问题。相比现有方案,PlayerOne在动作对齐和场景交互方面表现更优,为沉浸式社交、虚拟探索等应用开辟新可能。原创 2025-06-17 00:11:07 · 1285 阅读 · 0 评论
分享