3D场景
文章平均质量分 91
AI生成未来
领先的AIGC和具身智能、大模型技术交流社区,关注LLM、CV、深度学习、生成式等人工智能领域前沿技术。更多精彩内容,请关注公众号:AI生成未来
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
全景宇宙黑科技!HunyuanWorld 1.0 发布:一键生成360°可交互3D世界
腾讯混元世界1.0(HunyuanWorld1.0)是一个创新的3D世界生成框架,通过融合2D与3D生成技术,实现从文本/图像创建沉浸式可交互3D场景。其核心是语义分层的3D网格表示,支持360°全景世界代理、分层重建和物体级解耦建模。采用全景图像作为世界代理,结合深度估计、网格变形和世界一致性视频扩散等技术,解决了传统方法在3D一致性、交互性和可扩展性方面的局限。实验表明,该系统在视觉质量、场景一致性和交互性上优于现有方法,支持VR、游戏开发、物理仿真等应用场景。原创 2025-08-05 21:42:46 · 1247 阅读 · 0 评论 -
几秒生成逼真3D场景,泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus
解决的问题实现从文本到3D场景的高效生成,适用于对象级别和场景级别。提升生成3D内容的保真度和几何质量,同时确保模型具备良好的泛化能力。改善现有方法在3D生成中的效率问题,实现快速且高质量的3D生成。提出的方案多视图、前馈、像素对齐的3D高斯生成:将3D场景生成表述为在隐空间变量扩散框架中的这一过程。两阶段训练框架第一阶段:训练3D高斯变分自编码器(GS-VAE),以多视角或单视角的RGB-D图像为输入,预测每个像素对齐的3D高斯。第二阶段。原创 2025-01-16 22:38:54 · 1346 阅读 · 0 评论 -
斯坦福&UC伯克利开源突破性视觉场景生成与编辑技术,精准描绘3D/4D世界!
现有的场景图表示方法在生成复杂场景时存在保真度不足的问题,缺乏精确的控制和编辑能力。场景语言对于场景 ,记作 ,其形式定义如下:这里, 是自然语言短语的集合,被称为词语,例如,,如下图 2 所示。是一个程序,由一组实体函数 组成,并由 索引。每个实体函数 定义了场景中的一个实体类;它由相关联的 唯一标识,简洁地总结了定义类的语义含义。每个 将神经 embeddings 映射到场景中的特定实体 ,其中 指定了 的属性和身份,例如棋子的特定颜色,而 指定了其子实体的身份。原创 2024-11-20 13:09:43 · 2623 阅读 · 0 评论 -
Amazing!精准可控新视角视频生成+场景级3D生成!北大&港中文&腾讯等开源ViewCrafter
Sora等在大规模真实场景视频数据集上训练得到视频扩散模型能够学到对3D物理世界的深入理解,从而使其从单张图像或文本提示中生成复合物理规律和现实世界规则的视频内容。然而,由于它们缺乏场景的底层3D信息,因此难以在视频生成过程中实现精确的相机视角控制。原创 2024-09-13 09:04:49 · 2097 阅读 · 0 评论
分享