- 博客(8)
- 收藏
- 关注
原创 dust3r
对于给定场景中的所有图像,首先构建一个连通图 G,其中每个节点代表一幅图像,而边则代表具有重叠视觉内容的图像对。通过网络对每一对图像预测点图(pointmaps)及其置信度,可以判断哪些图像对具有有效的匹配关系。与传统方法不同,这里的优化目标不是最小化2D重投影误差,而是直接最小化3D点的对齐误差。与传统方法不同,这里的优化目标不是最小化2D重投影误差,而是直接最小化3D点的对齐误差。,图像1在1坐标系下经过R,t旋转平移转换到2坐标系下,R,t即为求得的相对位姿。,用来处理预测和真值之间的尺度模糊。
2025-04-01 14:37:58
520
原创 feature 3dgs and gaussion grouping
(2)然后,为了获得跨训练视图的一致掩码 ID,采用一个通用的时间传播模型 [7] (Tracking Anything with Decoupled Video Segmentation,分割视频任务,能够把不同帧之间的分割掩码关联)来关联掩码标签并生成连贯的多视图分割。(但在semantic-nerf论文中提到过语义特征的学习并不影响RGB图像渲染,可能还可以互相促进,直观感受上这两者不应该是互相干扰产生不利影响的互动,语义信息和RGB外观信息应该是可以相互补充的,文中也没有具体实验来说明……
2025-03-26 17:46:08
874
原创 Mip-Splatting阅读
那么此时在表示高频信息时(现实场景中的大量细节),扩张的2D高斯会变小,对已经很小的高斯系统性地低估其尺度。但对图像进行放大,采样率变大,分辨率增加,相机移近时,出现很多细小的高斯,产生侵蚀伪影。3D对象投影所覆盖的区域小于像素,但扩张的高斯没有被衰减,比物理到达像素的光积累更多。(a)是正常的表示,对投影的高斯扩大一个像素,但(a)中投影后的情况和(b)中投影后的情况基本一致。(1)引入3D平滑滤波器,将3D表示的频率限制在训练图像确定的最大采样率的一半以下,在放大时消除高频伪影。
2025-02-27 20:04:40
996
原创 Multi-Scale 3D GS阅读
在 3D Gaussian Splatting 的渲染过程中,每个“点”被投影到屏幕上,会用一个 2D 高斯函数来表示其在像素平面上的影响范围(即“splat”)。选择性渲染过滤掉太大的高斯和太小的高斯。在任何分辨率或相机距离的渲染过程中,如果高斯图像在屏幕上的像素覆盖率满足以下条件,则选择高斯图像进行渲染。(1)当以低分辨率或从远处看这些区域时,许多飞溅的小高斯分布在一个像素中,因此该区域的像素颜色由最前面的高斯分布主导。在给定相机方向的渲染过程中,每个飞溅高斯的颜色在该像素覆盖范围内是恒定的。
2025-02-26 17:25:57
574
原创 3d高斯学习记录
(1)引入各向异性的3D高斯分布作为高质量、非结构化的辐射场表达;3D高斯是一个可微的体积表示,同时可以通过将3D高斯投影到2D来非常有效地进行光栅化,使用标准α\alphaα混合,与NeRF图像像素渲染模型一致。(2)优化3D高斯的各个属性(3D位置、不透明度opacityα\alphaα、各向异性的协方差矩阵Σ\SigmaΣ、球谐函数系数),自适应密度控制调整3D高斯生成,生成高质量的场景表示;大片均匀区域可以用少量的大各向异性高斯来表示(协方差矩阵大的高斯,大的三维椭球)
2025-02-25 10:08:24
457
原创 神经辐射场NeRF入门(NeRF、Mip-NeRF、Instant-NGP、NeRF++)
NeRF后续NeRF++NeRF对于没有边界的场景存在分辨率的问题,NeRF采样的点放在前景部分,前景清晰,背景模糊;放在整个场景中,前景背景都变模糊。NeRF++分开前景和背景NeRF具有组合的特性,用两个NeRF模型,一个表示前景,一个表示背景。对于360 outward-facing的场景,其和360 inward-facing呈现出对称的性质,因此可以把单位球域外的无边界区域映射到有边界单位cube里。距离近的场景压缩小,远距离场景压缩多,分辨率低。
2024-12-16 23:09:45
992
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人