満湫-优快云博客

原创记录一下安装ubuntu子系统的pycharm遇到的问题

同样遇到这个问题，解决方法是：先新建一个用户名，然后再切换到这个新的用户名在 Pycharm*/bin 下运行 sudo ./pycharm.sh。

2024-03-26 10:09:32 586

原创 pytorch学习笔记（十二）

以下代码是以CIFAR10这个10分类的图片数据集训练过程的完整的代码。

2024-01-31 11:16:01 1183

原创 pytorch学习笔记（十一）

把搭建好的模型拿来训练，得到最优的参数。在debug的过程中选择最后三行，观察梯度变化其中optim.step()会把每一步更新的梯度用于数据的更新。

2024-01-22 19:48:10 675 1

原创 pytorch学习笔记（十）

举个例子比如说根据Loss提供的信息知道，解答题太弱了，需要多训练训练这个模块。Loss作用：1.算实际输出和目标之间的差距2.为我们更新输出提供一定的依据（反向传播）看官方文档每个输入输出相减取平均取绝对值再取平均。

2024-01-13 10:11:42 505

输入进过一次卷积，然后经过一次最大池化，尺寸变成16*16了，在经过一次卷积尺寸没变，紧接着进过了一次最大池化，变成了8*8，再经过一次卷积通道数改变32→64，再经过一次池化变成4*4，然后展平，最后输出。这边要注意接触padding[0]的时候要先stride[0]进行一个合理的取值，这边要去stride[0]=1而不是更大，因为太大的stride=2以上会导致padding太大不合理。（1-2）根据图里面看，32×32经过卷积后的尺寸仍然是32×32，该如何设置，公式中的参数尺寸。

2024-01-13 08:59:06 457

原创 pytorch学习笔记（七）

池化类似压缩最大池化-上采样例如给一个3的话就会生成一个3×3的窗口（生成相同的高和宽），给一个tuple就会给出一个相同的池化核。stride默认值就是核的大小dilation在卷积dialation设置之后每一个会和另外的差一个，空洞卷积ceil floor 模式（天花板、地板）floor就是向下取整。按下面的方法走，走的步数默认为核的大小。

2024-01-12 21:16:11 419

原创 pytorch学习笔记

随机抓取64张图片效果展示，并且对比了drop_list有没有的情况，没有drop_list的情况下有156步，但是第156步只有16张图片，这可能导致获取的数据的大小不合适。这边batch_size=4的效果，相当于它会把getitem得到的数据进行一个打包，然后做dataloader的返回。以扑克牌为例，batch_size就是每次去抓牌抓两张，shuffle打乱，num_workers多个进程。drop_last，例如我们有100张拍，要取他的1/3，当他除不尽，剩下的余数是要取出来还是舍去。

2024-01-03 14:04:05 408 1

原创 Human3.6m数据集预处理的一个小步骤

human3.6m预处理学习

2023-12-26 16:43:56 1236 3

原创残差网络学习

在Dense Block里面，每一层都与它之后的所有层相连，这样就能更加强大的释放以后每一个尺度的特征。一路加深了模型，网络分为两支，一路是同样的浅层网络处理，另一路保留原来的输入，恒等映射。不需要再拟合复杂底层的那个映射了，原来输入的基础上你需要进行哪些偏移哪些修改。深度估计，Depth estimation用视觉的方法评估画面的深度。网络退化，不是梯度消失（根本没有开始学习），梯度爆炸，过拟合。2.做1*1的卷积，把维度调整到和残差块一样。残差，Relu重要的给1，不重要的给0。

2023-12-21 20:24:32 428

原创 pytorch学习笔记（五）

内置call的调用方法两种，第一种,直接使用对象，不用使用点，直接调用的是__call__给定的是一个序列的话，就会改成（h,w）,如果只给了一个维度int，就会出现一个等比的缩放。当要调用的时候直接写个Person()按住ctrl+P看看需要填啥参数。先resize变成PIL类型的，然后将他转化成tensor类型的。关注不同的方法输入是什么类型，输出是什么类型。（1）关注输入和输出类型多看官方文档。（2）关注方法需要什么参数输入。输出结果裁剪了0-90个。（3）看输出是什么类型。

2023-12-21 09:11:57 436

原创 pytorch学习笔记（四）

在例子中可以看到，一个图片先进行一个transforms. centercrop( 10)图片中心裁剪，transforms.ToTensor然后返回一个tensor。首先根据Totensor这个工具的模具，创造一个工具，然后使用工具，需要一个输入input然后返回一个结果。学习一下，Tensor的数据类型区别于普通的数据类型，怎么使用Tensor？tensor包装了神经网络理论基础的一些参数。然后学习一个常用的类ToTensor。先看看这个.py文件的一些类。以Compose为例。

2023-12-20 21:08:44 400 1

原创 pytorch学习笔记（三）

这边除了端口要注意路径问题，因为我自己的logs文件不是生成在工程的根目录下的，因此，要logdir右边写成绝对路径或者相对路径。这边要注意的是writer.add_image()这东西对输入的图片的形状也需要定义要求，dataformats="HWC"这边是数据格式需要高宽通道。这边的目标是画y = 3x这个图像，但是由于图像的标签还是y=2x，会出现一个由于拟合过程和产生的非线性过程。运行发现读取的img不满足，img_tensor参数的要求,于是用numpy或者opencv-python去读。

2023-12-20 16:31:24 422 1

原创 pytorch学习笔记（二）

关于为啥使用self，因为，一个函数的变量不能给另外一个函数使用，它的作用就是把这个函数的变量给另外一个函数使用，相当于指定了一个函数的全局变量。Dataset可以进行一个编号的控制，提供一种方式去获取数据及其label。根路径的生成，用os.path.join这个函数不容易出现转义上的错误。主要是重写，__getitem__()，__add__()这两个类。从上往下分别是根目录地址，标签地址，总的地址，然后获取图片的一个列表。为了更好的了解上述两种加载方式，先了解下几种组织形式。.txt的+label。

2023-12-18 11:26:49 374

原创 Pytorch学习笔记（一）

修改b = "2019"，也就是说，代码以块为一个整体运行的话：python文件的快是所有行的代码。这边形象的用1234代表工具箱，abc表示里面的道具，使用hlep来看a这个工具怎么使用的。三个程序相同，但是都有一个错误，实验的目的是为了看在不同的环境下运行有啥优势。按回车的时候默认是以C:\Users\Zhiyao这个地址打开的目录。优:利于代码阅读及修改缺:环境需要配置。在这里创建新的文件，选择相应的环境。以每一行为一个块（任意行），运行的。优:通用，传播方便，适用于大型项目。优:显示每个变量属性。

2023-12-18 09:03:15 362

原创读取mmpose的输出（.json），并且给关键点打上新标签

程序的目的是提取关键点，并且给关键点按身体部位打上标签。

2023-12-13 08:39:11 554 1

原创复现mmpose遇到的一些问题

感悟：在学习工具包的时候，安装的时候一定要认准官方的，但是也不能所有都按着官方装，因为它有时候只给个大概，然后是面对不同demo文件要去看看结合官方文档，以及函数自带-h去看看咋用。但是命令栏里面是带了单引号的，这边我比较困惑，我师兄带单引号能运行我不行，这边可能因人而异，或者我漏了装什么。这是一种不安全、不受支持、未记录的解决方法，因此请在使用之前谨慎考虑，并注意它可能引起的问题。本人课题的一个方面就是做3D关节检测的，所以这么用了推理器的运行。不是一个合法的文件路径，或者在某些情况下，

2023-12-05 16:51:50 1343

原创记录一下最近复现motionBERT和Alphapose遇到的问题

一、Alphapose首先是Alphapose，遇到的问题是：1.加载到100%的时候卡住2.Opencv报错：Failed to load OpenH264 library: openh264-1.8.0-win64.dll首先解决第一个问题，根据警告提示，Userwarning: Failed to load image Python extension:warn(f"Failed to load image python extension: ie}")

2023-12-02 21:47:51 1670 1

原创 cudnn安装

和版本cuda对应下载cudnn，然后用cd命令跳转到子系统的mnt中，这个mnt说白了就是子系统和windows的一座桥，进去找到你下文件的那个地方。然后进入测试cudnn环节，真特么头大，重点是环境变量配置，前三部都很顺利呀，到最后一步报了这个错，其主要原因应该是读不到。尽管安装过程都很头大，主要原因还是网上的解决方法太碎片化了，以后咱不偷懒，把自己遇到的问题都总结起来。参考1和参考2去解决，跟着github上的步骤走了一遍。根据官方文档去安装吧，我的是wsl2子系统，所以先根据官网地址。

2023-11-14 16:20:17 105 1

原创 wsl（ubuntu在）安装cuda11.8

参考这个主要是要从驱动版本那边。

2023-11-13 20:23:21 320 1

原创 Ubuntu 上安装make命令，并使用

为了论文复现，根据依赖包准备在linux上安装python3.7。在装TensorFlow之前先装个虚拟环境，但我遇到一个问题。常用的打断快捷键 CTRL+C可以打断linux的进程。紧接着开始试验怎么在上面写代码了。2.用gcc和g++编译c文件或者c++其中遇到一个问题，我要卸载的问题。目标要装TensorFlow。1.先装anaconda。2.装TensorFlow。然后在里面先写个简单代码。来确认保存，最后按下。1.生成和删除c文件。

2023-11-12 11:15:58 291 1

原创 mmskeleton的安装

关于mmskeleton安装的一些问题

2023-10-30 19:46:16 426 10

原创 Anaconda卡在loading application

安装Anaconda3-6.3.0-Windows-x86_64，启动anaconda一直卡在loading applications，试过卸载重装几遍不能解决问题，安装好之后，默认的镜像是官方的，由于官网的镜像在境外，使用国内的镜像能够加快访问的速度，当然不配置也行，就是速度慢。【注】这边一般不建议这么下载会报错，输入下方命令从豆瓣下载，速度快不易报错。速度加快不容易出错，如果你下载的就是清华镜像这步忽略。首先要确定，anaconda3的路径对。紧接着是tensorflow的安装。③验证功能正常：输入。

2023-04-27 20:42:24 2142

weixin_44680341的博客