
PyTorch
文章平均质量分 74
Arnold-FY-Chen
On the way of AI spiritual practice...
展开
-
解决DCNv2不能使用高版本pytorch编译的问题
由于pytorch自1.11版开始发生了很大变化,原来基于C实现的THC封装实现的调用cuda、cudnn和cublas的API(只能用NVIDIA的GPU)被基于C++实现的ATen和c10里的API代替(ATen通过vulkan实现支持NVIDIA以外的GPU, ATen代码在https://github.com/pytorch/pytorch/tree/main/aten/src/ATen),THC下的文件基本被删掉了,所以编译DCNv2时会遇到很多错误。原创 2023-09-03 13:43:33 · 1644 阅读 · 3 评论 -
大数组需要循环单个赋值时适合在GPU上还是CPU上运算?
大数组需要循环单个赋值时适合在GPU上还是CPU上运算?就上面的循环赋值运算的性能来说,我实验得到的结果是: python list > numpy.ndarray > torch.tensor。原创 2022-10-23 19:49:48 · 1291 阅读 · 2 评论 -
一次诡异的numpy数组越界访问
而是类似上面这样给出spawn里的发起调用的位置这种没用的信息,再就是进程出错的粗略原因,后者稍微有点用,但是只有这个信息很难快速定位出错的根本原因!像上面这个SIGSEGV错误,花了好一阵时间才定位到出错的地方,居然是一个numpy数组越界访问了,很简单: m = ms[j, i],而python没有任何out of bounds这样的错误抛出来!不知为何上面的情况下抛不出IndexError,而是允许非法越界访问直到某个时候发生SIGSEGV错误而崩溃。原创 2022-10-01 23:45:27 · 2265 阅读 · 0 评论 -
PyTorch的gradcheck()报错问题RuntimeError: Jacobian mismatch for output 0 with respect to input 1的解决
有时遇到有的模型训练或测试脚本执行时遇到torch.autograd.gradcheck()抛出类似如下的错误:有时报的是Jacobian mismatch for output 0 with respect to input 0,这个出错的原因都是一个:torch.autograd.gradcheck()要求参数计算的PyTorch Tensor数据都是torch.DoubleTensor类型的(torch.float64),也就是双精度数据,而不是默认的torch.FloatTensor类.原创 2021-09-21 18:47:23 · 2191 阅读 · 0 评论 -
TensorRT 命令行程序trtexec常用用法
安装TensorRT后,进入到/usr/src/tensorrt/bin目录下,可以看到有个trtexec二进制可执行文件,执行 ./trtexec --help可以看到命令行支持的所有参数项:=== Model Options === --uff=<file> UFF model --onnx=<file> ONNX model --model=<file> Caffe原创 2021-08-15 18:07:31 · 15123 阅读 · 7 评论 -
如何解析trtexec输出的模型推理结果数据
还是以onnx为例,执行下面的命令解析onnx生成engine并推理输出结果到一个json文件:./trtexec --onnx=efficientdet-d0-s.onnx --loadInputs='data':o4_clip-1_raw_data.bin --saveEngine=efficientdet-d0-s.engine --exportOutput=trtexec-result.json这个--exportOutput指定的json文件里保存的是network的输出节点的数据,对原创 2021-08-15 20:51:39 · 2705 阅读 · 0 评论 -
安装CUDA时报错ModuleNotFoundError: No module named Quirks的原因
不久前在实验使用https://github.com/StanfordVL/rubiksnet这个视频动作识别模型时,发现其对python版要求3.7以上,于是尝鲜下载了个python3.9.6编译安装:wget https://www.python.org/ftp/python/3.9.6/Python-3.9.6.tgztar xf Python-3.9.6.tgzcd Python-3.9.6sudo apt-get install build-essential python3-dev原创 2021-08-14 19:38:17 · 2902 阅读 · 0 评论 -
我的AI之路(54)--使用Pytorch内置的动作识别模型
Pytorch内集成有视频分类功能,提供了三个基于Kinectis400/600/700数据集(https://deepmind.com/research/open-source/kinetics)训练的网络模型(ResNet3D、Mixed Convoluation、R(2+1)D )可用来实现视频动作识别(Activity Recognition)。 相关论文链接https://arxiv.org/abs/1711.11248 模型的代码参见 https://...原创 2021-08-01 21:08:09 · 2223 阅读 · 0 评论 -
我的AI之路(45)--使用自己的数据集训练CenterNet
CenterNet是anchor-free类型网络,具有识别精度高且速度快的特点,根据作者的论文中列出的数据来看,指标综合考虑来看比较牛了: 最后那个CenterNet-HG,也就是backbone使用的Hourglass-104网络的AP值只比FSAF低一点了(但是FSAF目前貌似还没有源码放出来),比YOLO序列和RCNN序列都强很多,虽然FPS自有7.8,但是对一般实...原创 2020-03-14 11:46:31 · 3337 阅读 · 20 评论 -
我的AI之路(35)--使用tensorflow和pytorch的docker镜像
从docker远程仓库拉取自己想要的镜像,首先最好查看docker镜像的版本号TAG,以确认版本是自己想要的,查看docker镜像的版本号,需先打开网页:https://hub.docker.com/r/library/然后左上角输入名字搜索想要的镜像,比如tensorflow:在列出的结果中点击进入相应的主页后,点击Tags标签,查找自己想要的版本,然后点击右边相应的复制按钮复制...原创 2019-12-22 18:38:32 · 1790 阅读 · 0 评论 -
我的AI之路(17)--Tensorflow和Caffe的API及Guide
个人经验觉得,任何一门语言或框架或SDK工具,功能越多API也越多,不可能在短时间内全部熟悉且记得住,一般都是工作中一点一点多次使用接触后才慢慢熟悉掌握全部API的,在此之前只能是在读别人的代码、修改别人的代码或自己写代码时根据需要去多次反复查阅API和Guide文档,来逐渐熟悉和掌握每个API。 为作为一个读代码时方便查阅的集中入口,把Tensorflow和Caffe的API...原创 2018-09-09 17:15:01 · 687 阅读 · 0 评论 -
我的AI之路(6)--安装PyTorch
边看<<深度学习框架 PyTorch入门与实践>>,边满怀欢喜的跑到https://pytorch.org/ 上准备安装PyTorch 0.4版,根据https://github.com/pytorch/pytorch/releases说的0.4做了一些重要的改进而且还支持Windows了,好事啊,可是怎么点击https://pytorch.org/ 这些按钮怎么都...原创 2018-05-26 11:35:43 · 1109 阅读 · 0 评论