
PyTorch
文章平均质量分 79
整理PyTorch系列相关资料,学习经验,二次分享。
工头阿乐
实践是检验真理的唯一标准。
展开
-
yolo模型train.py文件训练参数详解
手把手调参。原创 2025-03-20 14:26:36 · 943 阅读 · 0 评论 -
PyTorch分布式训练中各节点如何通信
1、分布式节点如何知道彼此并通信。每个节点启动训练任务需要设置主节点的ip:port,通过跟主节点通信来启动服务。2、是不是每个节点都要执行python程序。是的,写好训练代码后,每个节点都需要执行python命令,但是一般平台会帮我们管理分布式服务,自动把脚本分发到各个节点,并执行python成勋,才会产生不需要每个节点执行python代码的错觉。3、如果忘记在某个节点执行python命令,结果会怎样。ddp会阻塞在初始化的位置,一直等到有world_size进程为止,这个就是靠主节点来跟踪进程数。原创 2025-03-20 11:07:08 · 1192 阅读 · 0 评论 -
远程调试Python脚本之ptvsd
有时候需要远程调试Python脚本,怎么办呢…以下这段代码用于远程调试 Python 脚本,特别是通过 Visual Studio Code(VS Code)的远程调试功能。它会在指定的服务器 IP 和端口上等待调试器的连接。# 检查是否提供了服务器 IP 和端口# 远程调试 - 参见 https://code.visualstudio.com/docs/python/debugging#_attach-to-a-local-script# 打印等待调试器连接的消息。原创 2025-02-11 09:50:29 · 308 阅读 · 0 评论 -
yolov9目标检测报错AttributeError: ‘list‘ object has no attribute ‘device‘
main(opt)这行代码错误,应该是照抄了yolov5的代码改成以下代码,问题解决,完美解决。原创 2024-12-10 16:24:57 · 720 阅读 · 0 评论 -
基于Pytorch搭建分布式训练环境
随着近几年大模型的问世,传统的单机单卡模式已经无法满足超大模型进行训练的要求,如何更好地、更轻松地利用多个 GPU 资源进行模型训练成为了人工智能领域的热门话题。我们今天为大家带来的这篇文章详细介绍了一种名为 DDP(Distributed Data Parallel)的并行训练技术,作者认为这项技术既高效又易于实现。(1) DDP 的核心思想是将模型和数据复制到多个 GPU 上并行训练,然后汇总平均梯度。原创 2024-03-08 17:02:02 · 2346 阅读 · 0 评论 -
通过实验验证GAP、GMP、FC性能表现
简单来说,就是在卷积层之后,用GAP替代FC全连接层。有两个有点:一是GAP在特征图与最终的分类间转换更加简单自然;二是不像FC层需要大量训练调优的参数,降低了空间参数会使模型更加健壮,抗过拟合效果更佳。我们再用更直观的图像来看GAP的工作原理:假设卷积层的最后输出是h × w × d 的三维特征图,具体大小为6 × 6 × 3,经过GAP转换后,变成了大小为 1 × 1 × 3 的输出值,也就是每一层 h × w 会被平均化成一个值。原创 2024-02-29 11:23:57 · 1516 阅读 · 0 评论 -
pth模型文件转为onnx格式
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。原创 2023-04-14 14:52:09 · 10212 阅读 · 0 评论 -
通过阿里云函数计算解决ChatGPT API的调用问题
自2022年11月30日 OpenAI 发布 ChatGPT 以来,虽然时有唱衰的声音出现,但在OpenAI不断推陈出新,陆续发布了OpenAPI、GPT-4、ChatGPT Plugins之后,似乎让大家看到了一个聊天机器人往操作系统入口进军的升纬之路。ChatGPT能被认为是操作系统级别的入口平台,那么必然会催生各行各业应用的重新入局。对此,作为一名开发者来说,面对这样的变革,应该尽早的去了解与实践,在蓝海里更容易找到一份自己的位置。目前DD知道的就有不少小伙伴在基于其API做一些出海的应用。原创 2023-04-11 20:57:48 · 9100 阅读 · 0 评论 -
PyTorch C++系列教程2:使用自定义数据集
在上一篇文章中,我们讨论了如何使用 PyTorch C++ API 实现 VGG-16 来识别 MNIST 数据集。这篇文章我们讨论一下如何用 C++ API 使用自定义数据集。在下一篇教程中,我们将介绍如何在 CNN 中使用自定义的 data loader。原创 2023-04-04 20:38:19 · 436 阅读 · 0 评论 -
PyTorch C++系列教程1:用 VGG-16 识别 MNIST
本文讲解如何用 PyTorch C 实现 VGG-16 来识别 MNIST 数据集。完整代码请参考:参考资料。原创 2023-04-04 20:11:24 · 559 阅读 · 0 评论 -
模型部署入门教程汇总
OpenMMLab 的算法如何部署?是很多社区用户的困惑。而模型部署工具箱 MMDeploy 的开源,强势打通了从算法模型到应用程序这 “最后一公里”!原创 2023-04-03 20:10:06 · 510 阅读 · 0 评论 -
PyTorch框架训练的几种模型区别
在PyTorch中,.pt、.pth和.pth.tar都是用于保存训练好的模型的文件格式,它们之间的主要区别如下:.pt文件是PyTorch 1.6及以上版本中引入的新的模型文件格式,它可以保存整个PyTorch模型,包括模型结构、模型参数以及优化器状态等信息。.pt文件是一个二进制文件,可以通过torch.save()函数来保存模型,以及通过torch.load()函数来加载模型。.pth文件是PyTorch旧版本中使用的模型文件格式,它只保存了模型参数,没有保存模型结构和其他相关信息。原创 2023-03-29 15:42:13 · 10131 阅读 · 0 评论