自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 记录一下安装ubuntu子系统的pycharm遇到的问题

同样遇到这个问题,解决方法是:先新建一个用户名,然后再切换到这个新的用户名在 Pycharm*/bin 下运行 sudo ./pycharm.sh。

2024-03-26 10:09:32 586

原创 pytorch学习笔记(十二)

以下代码是以CIFAR10这个10分类的图片数据集训练过程的完整的代码。

2024-01-31 11:16:01 1183

原创 pytorch学习笔记(十一)

把搭建好的模型拿来训练,得到最优的参数。在debug的过程中选择最后三行,观察梯度变化其中optim.step()会把每一步更新的梯度用于数据的更新。

2024-01-22 19:48:10 675 1

原创 pytorch学习笔记(十)

举个例子比如说根据Loss提供的信息知道,解答题太弱了,需要多训练训练这个模块。Loss作用:1.算实际输出和目标之间的差距2.为我们更新输出提供一定的依据(反向传播)看官方文档每个输入输出相减取平均取绝对值再取平均。

2024-01-13 10:11:42 505

原创 pytorch学习笔记(八)

输入进过一次卷积,然后经过一次最大池化,尺寸变成16*16了,在经过一次卷积尺寸没变,紧接着进过了一次最大池化,变成了8*8,再经过一次卷积通道数改变32→64,再经过一次池化变成4*4,然后展平,最后输出。这边要注意接触padding[0]的时候要先stride[0]进行一个合理的取值,这边要去stride[0]=1而不是更大,因为太大的stride=2以上会导致padding太大不合理。(1-2)根据图里面看,32×32经过卷积后的尺寸仍然是32×32,该如何设置,公式中的参数尺寸。

2024-01-13 08:59:06 457

原创 pytorch学习笔记(七 )

池化类似压缩最大池化-上采样例如给一个3的话就会生成一个3×3的窗口(生成相同的高和宽),给一个tuple就会给出一个相同的池化核。stride默认值就是核的大小dilation在卷积dialation设置之后每一个会和另外的差一个,空洞卷积ceil floor 模式(天花板、地板)floor就是向下取整。按下面的方法走,走的步数默认为核的大小。

2024-01-12 21:16:11 419

原创 pytorch学习笔记

随机抓取64张图片效果展示,并且对比了drop_list有没有的情况,没有drop_list的情况下有156步,但是第156步只有16张图片,这可能导致获取的数据的大小不合适。这边batch_size=4的效果,相当于它会把getitem得到的数据进行一个打包,然后做dataloader的返回。以扑克牌为例,batch_size就是每次去抓牌抓两张,shuffle打乱,num_workers多个进程。drop_last,例如我们有100张拍,要取他的1/3,当他除不尽,剩下的余数是要取出来还是舍去。

2024-01-03 14:04:05 408 1

原创 Human3.6m数据集预处理的一个小步骤

human3.6m预处理学习

2023-12-26 16:43:56 1236 3

原创 残差网络学习

在Dense Block里面,每一层都与它之后的所有层相连,这样就能更加强大的释放以后每一个尺度的特征。一路加深了模型,网络分为两支,一路是 同样的浅层网络处理,另一路保留原来的输入,恒等映射。不需要再拟合复杂底层的那个映射了,原来输入的基础上你需要进行哪些偏移哪些修改。深度估计,Depth estimation用视觉的方法评估画面的深度。网络退化,不是梯度消失(根本没有开始学习),梯度爆炸,过拟合。2.做1*1的卷积,把维度调整到和残差块一样。残差,Relu重要的给1,不重要的给0。

2023-12-21 20:24:32 428

原创 pytorch学习笔记(五)

内置call的调用方法两种,第一种,直接使用对象,不用使用点,直接调用的是__call__给定的是一个序列的话,就会改成(h,w),如果只给了一个维度int,就会出现一个等比的缩放。当要调用的时候直接写个Person()按住ctrl+P看看需要填啥参数。先resize变成PIL类型的,然后将他转化成tensor类型的。关注不同的方法输入是什么类型,输出是什么类型。(1)关注输入和输出类型多看官方文档。(2)关注方法需要什么参数输入。输出结果裁剪了0-90个。(3)看输出是什么类型。

2023-12-21 09:11:57 436

原创 pytorch学习笔记(四)

在例子中可以看到,一个图片先进行一个transforms. centercrop( 10)图片中心裁剪,transforms.ToTensor然后返回一个tensor。首先根据Totensor这个工具的模具,创造一个工具,然后使用工具,需要一个输入input然后返回一个结果。学习一下,Tensor的数据类型区别于普通的数据类型,怎么使用Tensor?tensor包装了神经网络理论基础的一些参数。然后学习一个常用的类ToTensor。先看看这个.py文件的一些类。以Compose为例。

2023-12-20 21:08:44 400 1

原创 pytorch学习笔记(三)

这边除了端口要注意路径问题,因为我自己的logs文件不是生成在工程的根目录下的,因此,要logdir右边写成绝对路径或者相对路径。这边要注意的是writer.add_image()这东西对输入的图片的形状也需要定义要求,dataformats="HWC"这边是数据格式需要高宽通道。这边的目标是画y = 3x这个图像,但是由于图像的标签还是y=2x,会出现一个由于拟合过程和产生的非线性过程。运行发现读取的img不满足,img_tensor参数的要求,于是用numpy或者opencv-python去读。

2023-12-20 16:31:24 422 1

原创 pytorch学习笔记(二)

关于为啥使用self,因为,一个函数的变量不能给另外一个函数使用,它的作用就是把这个函数的变量给另外一个函数使用,相当于指定了一个函数的全局变量。Dataset可以进行一个编号的控制,提供一种方式去获取数据及其label。根路径的生成,用os.path.join这个函数不容易出现转义上的错误。主要是重写,__getitem__(),__add__()这两个类。从上往下分别是根目录地址,标签地址,总的地址,然后获取图片的一个列表。为了更好的了解上述两种加载方式,先了解下几种组织形式。.txt的+label。

2023-12-18 11:26:49 374

原创 Pytorch学习笔记(一)

修改b = "2019",也就是说,代码以块为一个整体运行的话:python文件的快是所有行的代码。这边形象的用1234代表工具箱,abc表示里面的道具,使用hlep来看a这个工具怎么使用的。三个程序相同,但是都有一个错误,实验的目的是为了看在不同的环境下运行有啥优势。按回车的时候默认是以C:\Users\Zhiyao这个地址打开的目录。优:利于代码阅读及修改缺:环境需要配置。在这里创建新的文件,选择相应的环境。以每一行为一个块(任意行),运行的。优:通用,传播方便,适用于大型项目。优:显示每个变量属性。

2023-12-18 09:03:15 362

原创 读取mmpose的输出(.json),并且给关键点打上新标签

程序的目的是提取关键点,并且给关键点按身体部位打上标签。

2023-12-13 08:39:11 554 1

原创 复现mmpose遇到的一些问题

感悟:在学习工具包的时候,安装的时候一定要认准官方的,但是也不能所有都按着官方装,因为它有时候只给个大概,然后是面对不同demo文件要去看看结合官方文档,以及函数自带-h去看看咋用。但是命令栏里面是带了单引号的,这边我比较困惑,我师兄带单引号能运行我不行,这边可能因人而异,或者我漏了装什么。这是一种不安全、不受支持、未记录的解决方法,因此请在使用之前谨慎考虑,并注意它可能引起的问题。本人课题的一个方面就是做3D关节检测的,所以这么用了推理器的运行。不是一个合法的文件路径,或者在某些情况下,

2023-12-05 16:51:50 1343

原创 记录一下最近复现motionBERT和Alphapose遇到的问题

一、Alphapose首先是Alphapose,遇到的问题是:1.加载到100%的时候卡住2.Opencv报错:Failed to load OpenH264 library: openh264-1.8.0-win64.dll首先解决第一个问题,根据警告提示,Userwarning: Failed to load image Python extension:warn(f"Failed to load image python extension: ie}")

2023-12-02 21:47:51 1670 1

原创 cudnn安装

和版本cuda对应下载cudnn,然后用cd命令跳转到子系统的mnt中,这个mnt说白了就是子系统和windows的一座桥,进去找到你下文件的那个地方。然后进入测试cudnn环节,真特么头大,重点是环境变量配置,前三部都很顺利呀,到最后一步报了这个错,其主要原因应该是读不到。尽管安装过程都很头大,主要原因还是网上的解决方法太碎片化了,以后咱不偷懒,把自己遇到的问题都总结起来。参考1和参考2去解决,跟着github上的步骤走了一遍。根据官方文档去安装吧,我的是wsl2子系统,所以先根据官网地址。

2023-11-14 16:20:17 105 1

原创 wsl(ubuntu在)安装cuda11.8

参考这个主要是要从驱动版本那边。

2023-11-13 20:23:21 320 1

原创 Ubuntu 上安装make命令,并使用

为了论文复现,根据依赖包准备在linux上安装python3.7。在装TensorFlow之前先装个虚拟环境,但我遇到一个问题。常用的打断快捷键 CTRL+C可以打断linux的进程。紧接着开始试验怎么在上面写代码了。2.用gcc和g++编译c文件或者c++其中遇到一个问题,我要卸载的问题。目标要装TensorFlow。1.先装anaconda。2.装TensorFlow。然后在里面先写个简单代码。来确认保存,最后按下。1.生成和删除c文件。

2023-11-12 11:15:58 291 1

原创 mmskeleton的安装

关于mmskeleton安装的一些问题

2023-10-30 19:46:16 426 10

原创 Anaconda卡在loading application

安装Anaconda3-6.3.0-Windows-x86_64,启动anaconda一直卡在loading applications,试过卸载重装几遍不能解决问题,安装好之后,默认的镜像是官方的,由于官网的镜像在境外,使用国内的镜像能够加快访问的速度,当然不配置也行,就是速度慢。【注】这边一般不建议这么下载会报错,输入下方命令从豆瓣下载,速度快不易报错。速度加快不容易出错,如果你下载的就是清华镜像这步忽略。首先要确定,anaconda3的路径对。紧接着是tensorflow的安装。③验证功能正常:输入。

2023-04-27 20:42:24 2142

原创 python中出现could not convert string to float:的问题

python中出现could not convert string to float:的问题

2023-03-22 16:31:25 2945

原创 Python中的%用法

学习过程中偶遇的python中的%用法

2023-03-21 21:28:27 726

原创 python

基于广义矩阵的,对于numpy中的sum(axis=0),sum(axis=1)理解

2023-03-09 21:51:53 50

原创 个人在在调用包的时候出现需要class, interface或enum,import java.util.Scanner;错误记录

错误总结

2023-03-02 20:16:21 561 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除