自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 分布式训练笔记

本文介绍了深度学习的分布式训练方法,主要分为模型并行和数据并行两种。模型并行适用于参数量极大的模型(如671B参数模型),数据并行则是日常更常用的方法。文章重点分析了PyTorch的DDP(DistributedDataParallel)实现,详细说明了单机多卡和多机多卡的实现原理及代码示例。DDP通过梯度分组和AllReduce操作实现高效并行训练,能自动处理梯度同步和权重更新。文章还提供了实际运行脚本示例,包括环境变量设置、进程初始化等关键步骤,并列出了相关参考资料的来源。

2025-08-08 15:13:06 820

原创 安装nvidia-docker遇到的问题

E: 仓库 “https://nvidia.github.io/nvidia-container-runtime/stable/ubuntu18.04/amd64 Release” 没有 Release 文件。E: 仓库 “https://nvidia.github.io/libnvidia-container/stable/ubuntu18.04/amd64 Release” 没有 Release 文件。N: 参见 apt-secure(8) 手册以了解仓库创建和用户配置方面的细节。

2024-12-05 21:18:11 1309

原创 在cpp文件修改px4的参数

用mavros_msgs/ParamSet.h修改px4中的参数。以EKF2_AID_MASK为例子。

2024-11-08 18:49:17 275

原创 XTDrone 视觉里程计(VIO)环境配置过程遇到的问题

方法一:换到与github仓库相同的旧版本(我没试过,改了一半才意识到这样可能快一点)刚刚发现github有人上传改好的,可以试试。方法二:修正所有用了旧版本库的文件。修改opencv库相关文件。修改ceres库相关文件。

2024-10-25 19:36:00 410

原创 解决python安装apex库遇到的问题

前面遇到了好几个问题,但是已经有人写了文章了,不再赘述,下面最后一个问题。有文章说要自己下载git的文件直接安装,至少我是失败了。,直接pip install失败了,最后。安装成功,再安装apex就成功了。

2024-08-10 02:50:08 512 1

原创 python实现PSO算法

【代码】python实现PSO算法。

2024-04-02 09:46:55 505 2

原创 解决tensorflow安装过程中的问题

用这个安装装得特别慢(tensorflow后面的数字表示版本,我装的是2.1版本)意思大概就是protobuf的版本太高,输入下面的代码下载一个低一点的版本就可以。import tensorflow的时候报错报了一大串,最后面是这个样子的。上网搜,在网上复制了用清华镜像网站下载,结果403报错了。装完可以用下面代码确认装好没有。讲讲我在安装过程遇到的问题。

2024-01-19 01:02:25 726 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除