vscode 单步调试docker容器内的分布式程序

vscode连接远程服务器,并在docker中利用torchrun分布式调试代码

遇到的问题: 我之前使用的经验是在conda 中调试,并且代码的启动方式是python XX.py 。像这样在docker容器内部并且调试多卡执行的程序着实费了一番功夫,下文主要是解决在vscode中调试分布式程序时的经验

vscode 连接远程服务器准备

远程资源管理器 的 SSH配置文件中,添加服务器的用户名和地址
点击小齿轮这里就可以添加啦

docker准备 (略)

在远程服务器中,

  1. 安装docker
  2. 拉取镜像
  3. 创建容器

在vscode中安装docker扩展

安装好之后会看到:

  1. 侧边栏有一个鲸鱼🐳图标
  2. 远程服务器所有的容器以及他们的状态
  3. 远程服务器所有的镜像
    在这里插入图片描述

从容器中新建VSCode窗口

  1. 在我们想要调试环境的容器中,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值