跑通FlashAvatar和GaussianAvatars

参考链接:

FlashAvatar的github链接
GaussianAvatars的github链接

问题汇总

  • 最重要是切换cuda版本为11.6,指定cuda为最高优先级,切换cuda版本参考,选择第二个,然后注意事项开篇已经写了.
  • 它内置了安装包,所以需要git clone 3次.表现为:No module named ‘simple_knn‘如何安装内置 包,pip install simple_knn是没用的!!!
  • pip的包会下载失败,需要自己手动下载,和安装diff-gaussian-rasterization失败的解决方案
conda env create --file environment.yml # pip的包会下载失败,需要自己手动下载.
sudo apt-get install libglm-dev # 如果遇到第一个报错
pip install submodules/diff-gaussian-rasterization
pip install submodules/simple-knn
pip install scipy
pip install chumpy
pip install scikit-image
pip install opencv-python
pip install ninja
pip install lpips
pip install loguru
  • 缺少frame model的解决方案,参考了GaussianAvatars的安装方案,表现为:FileNotFoundError:
    [Errno 2] No such file or directory: ‘flame/generic_model.pkl’,当然也可以在issue中找答案.Flame Model下载链接
Please download flame model to the following paths:
FLAME 2020 -> flame/generic_model.pkl
FLAME Vertex Masks -> flame/FLAME_masks/FLAME_masks.pkl
  • 最大问题:测试生成的视频有什么用?它的输入是前景分割图,人脸解析图,人脸追踪.FlashAvatar测试自己的数据集,但生成一个一模一样的视频有啥用?最开始看论文的介绍就有这个疑问.

结语

GaussianAvatars的readme写的很好,尤其是一些conda操作,但是有没有更快速运行的方式,我使用最小的218数据集都是4.7G,下载缓慢,而且没有预训练权重吗?还需要训练完才能推理吗?希望一起探讨.还有就是,英语不好确实恼火,尤其是某个单词在当下语境的含义?
昨天在GaussianAvatars提了上述issue,今天就出了对应demo,作者太给力了.

### 如何正确配置运行 SparseRCNN #### 配置环境 为了成功运行 SparseRCNN,首先需要确保开发环境已正确安装所需依赖项。常情况下,SparseRCNN 的实现基于 PyTorch Detectron2 框架。因此,需按照官方文档中的说明完成以下操作: - 安装 Python 版本 >= 3.6。 - 安装 PyTorch 及其对应的 CUDA 版本[^1]。 - 下载并编译 Detectron2 库。 可以过以下命令克隆仓库并安装必要组件: ```bash git clone https://github.com/facebookresearch/detectron2.git cd detectron2 pip install -e . ``` #### 数据集准备 SparseRCNN 支持 COCO 格式的标注数据集。如果计划使用自定义数据集,则需要将其转换为 COCO 格式。COCO 文件结构应包括 `images` `annotations` 子目录,并提供 JSON 文件描述图像路径及其边界框信息[^2]。 对于训练过程,建议遵循标准的数据预处理流程,例如调整输入尺寸、应用增强技术(如翻转、裁剪)、标准化像素值等。 #### 训练模型 一旦完成了上述准备工作,即可启动 SparseRCNN 的训练脚本。典型的工作流如下所示: 1. 修改配置文件以适配硬件资源与实验需求; 2. 调整超参数,比如学习率调度器策略、批量大小以及迭代次数; 3. 执行训练指令。 下面是一个简单的例子展示如何调用默认设置下的稀疏候选框机制进行端到端的学习: ```python from detectron2.engine import DefaultTrainer from detectron2.config import get_cfg cfg = get_cfg() cfg.merge_from_file("configs/sparsercnn.yaml") # 加载特定于 SparseRCNN 的 YAML 参数表单 trainer = DefaultTrainer(cfg) trainer.resume_or_load(resume=False) trainer.train() ``` #### 常见错误排查 当尝试部署 SparseRCNN 时可能会碰到若干挑战。以下是几种常见问题及解决方案: - **CUDA Out of Memory**: 如果显存不足,请减少每批次样本数量或者启用梯度累积方法来缓解压力[^3]。 - **Mismatched Shapes During Training/Inference**: 确认所有张量维度一致;特别是 ROI Align 层输出形状应当满足后续全连接层的要求。 - **Poor Performance on Validation Set**: 检查是否存在类别不平衡现象;适当增加正负样本比例有助于提升泛化能力。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值