训练 fast point transformer

最新推荐文章于 2024-11-08 23:48:29 发布

蓝羽飞鸟

最新推荐文章于 2024-11-08 23:48:29 发布

阅读量1.4k

点赞数 5

CC 4.0 BY-SA版权

分类专栏： DeepLearning 文章标签： transformer 深度学习 python

本文链接：https://blog.youkuaiyun.com/level_code/article/details/126483933

DeepLearning 专栏收录该内容

69 篇文章

订阅专栏

这篇博客介绍了如何搭建并使用FastPointTransformer进行3D点云的语义分割。首先，详细阐述了安装CUDA和cuDNN的步骤，并在.bashrc中设置路径。接着，通过Anaconda创建fpt环境，克隆FastPointTransformer及依赖库MinkowskiEngine的代码。在设置好conda路径后，运行setup.sh进行构建。数据预处理部分，提到了使用S3DIS数据集，并对代码进行相应修改。训练阶段，配置了数据路径，使用wandb进行监控，并给出了训练命令。遇到内存不足问题时，可通过调整batch_size解决。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Fast point transformer用于3D点云的语义分割，
paper和github主页

github链接

安装cuda

首先要安装cuda，github上指定的是11.1
cuda tookit链接
 cuDNN链接

cuda安装完以后记得在~/.bashrc中设置路径

export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-11.1

然后更新一下

source ~/.bashrc

安装anaconda

这个就不用多说了，去anaconda官网下一个sh文件
anaconda链接

建立fpt 环境

运行fast point transformer的conda环境是fpt
先把github上代码clone下来，
但是注意，它的thirdparty/MinkowskiEngine给的是链接，clone下来文件夹是空的，
要把MinkowskiEngine的github代码也clone下来

修改conda路径，在setup.sh的这一行

source /opt/anaconda3/etc/profile.d/conda.sh # you may need to modify the conda path.

开始build啦

bash setup.sh fpt

这一步会安装很多包，极有可能出现time out的情况。
build完成以后会出现这样的界面。
（反正挺艰难的，很多time out，还有could not find cuda runtime之类）
在这里插入图片描述

准备数据集

可以用ScannetV2 和 S3DIS,
ScannetV2数据集有1.2T，所以选了S3DIS数据集。
把它下载下来，文件夹为Stanford3dDataset_v1.2

fast point transformer用的数据为ply格式，需要预处理，
在preprocess_scannet.py中修改input 和 output path。

python src/data/preprocess_scannet.py # you need to modify the data path

处理完以后会得到s3dis_processed文件夹

接下来要把src/data下面的meta_data copy出来，
新建一个s3dis的路径，
把meta_data 和 s3dis_processed放到里面去
在这里插入图片描述

s3dis的路径要写到./config/s3dis/train_default.gin

# Data module
S3DISArea5RGBDataModule.data_root = "/root/data/s3dis" # you need to modify this according to your data.

训练

train.py运行以后会提示你要不要用wandb，如果选的用，
它会提示在wandb主页上注册一个账号，然后复制一个key过来，
具体参考quick start主页
要在train.py的开头加上这样两句，不加的话wandb会报错

import wandb

wandb.init(project="my-test-project")

然后就开始训练啦

(fpt) ~/FastPointTransformer$ python train.py config/s3dis/train_fpt.gin

在这里插入图片描述
中间保存的weight在experiments文件夹里，ckpt文件

如果出现cuda run out of memory，可以把batch_size改小一点

S3DISArea5RGBDataModule.train_batch_size = 2