需求:使用pycharm远程连接训练服务器,debug torchrun分布式训练
步骤:
1.软连接torchrun文件至工作区目录:
ln -s /root/miniconda3/envs/chinease_llma_alpaca/bin/torchrun 工作区/torchrun
2.同步远程 '工作区/torchrun' 至本地
Tools -> Deploymet->Download
3.配置远程python解释器
4.配置项目debug,选择'工作区/torchrun' 及对应参数即可
5.开心食用吧!!!