跑通Scaffold-GS代码

代码来源:https://github.com/city-super/Scaffold-GS

版本设置为autodl中的3090卡,cuda版本11.8,python版本为3.8.20,torch版本为2.0.0+cu118,torchaudio版本为2.0.1+cu118,torchvision版本为0.15.1+cu118,torch-scatter版本为2.1.1+pt20cu118,cudatoolkit版本为11.8。其余包版本和environment.yml中的一致。

torch-scatter直接用指令安装会显示查无此包,直接从网站上按照自己的cuda,torch和python版本下载对应包即可:https://data.pyg.org/whl/

然后修改single_train.sh中的路径,尝试运行。

会出现几个缺少包的报错(我这里是colorama,jaxtyping和cv2),用pip安装即可。

开始运行,首先会下载pth文件:vgg16-397923af.pth,然后输出一堆东西后就会开始训练了。

首次运行截图:

注:一定要注意CUDA,torch和python的版本一致性,优先保证一致,而不是强求和environment.yml内的版本一致。不然可能会出现栈溢出,或者两个simple-knn等两个3DGS自带包无法正确安装的问题。

### 如何复现 Scaffold-GS 项目 #### 获取源码与环境配置 为了成功复现 Scaffold-GS 的实验,首先需要获取项目的官方实现代码并设置合适的开发环境。访问项目主页[^1]可以找到 GitHub 链接,在那里下载最新的源代码。 安装依赖库之前,请确认已准备好 Python 环境以及必要的工具链(如 CMake)。按照 `README.md` 文件中的说明来创建虚拟环境,并过 pip 安装所需的第三方包列表。 ```bash git clone https://github.com/city-super/Scaffold-GS.git cd Scaffold-GS conda create --name scaffold-gs python=3.8 conda activate scaffold-gs pip install -r requirements.txt ``` #### 数据集准备 根据论文描述,模型训练所需的数据集应包含多视角图像序列及其对应的相机参数。对于特定场景下的三维高斯分布建模而言,这些数据至关重要。确保遵循文档指南完成数据预处理步骤,这常涉及将原始图片转换成适合输入网络的形式。 #### 锚点初始化策略 锚点作为构建结构化三维高斯体素的基础单元,在整个框架里扮演着重要角色。初始阶段会基于给定的几何先验信息设定一组稀疏但具有代表性的位置点;随着迭代优化逐步细化其布局直至收敛于最优解。此过程中采用了分层采样机制以平衡全局覆盖度和局部精度之间的关系[^2]。 #### MLP 初始化与训练流程 用于预测各维度特征值(比如颜色、不透明度等)的多层感知机(MLP),同样经过精心设计以适应不同尺度的变化特性。权重矩阵采用 Xavier 或 He 方式随机赋初值之后便进入正式的学习环节——即利用反向传播算法最小化损失函数从而更新参数直到满足终止条件为止。 ```python import torch.nn as nn class GaussianModel(nn.Module): def __init__(self, input_dim, hidden_dims, output_dim): super(GaussianModel, self).__init__() layers = [] dims = [input_dim] + hidden_dims + [output_dim] for i in range(len(dims)-1): layers.append(nn.Linear(dims[i], dims[i+1])) if i != len(dims)-2: layers.append(nn.ReLU()) self.mlp = nn.Sequential(*layers) def forward(self, x): return self.mlp(x) ``` #### Anchor 调整机制 在整个学习周期内动态调整 anchor 的数量及空间分布有助于提升最终效果的质量。具体做法是在每次 epoch 结束后统计当前误差分布情况,据此决定哪些区域应该增加新的节点或是移除冗余部分。这种自适应调节手段不仅能够加速收敛速度还能有效防止过拟合现象的发生。 #### 实验验证与评估指标 最后一步是对所得到的结果进行全面评测。除了视觉上的直观对比外,还需要借助定量分析方法衡量各项性能指标的好坏程度。常见的评价标准包括 PSNR、SSIM 值大小变化趋势图表展示等内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值