dwqy11-优快云博客

原创 FFmpeg使用手札

文章目录环境搭建1. 快速搭建（不考虑版本兼容）2. 安装ffmpeg-cuda加速3. ffmpeg-python环境搭建一些报错记录 & 原因 & 解决方法1. 报错：encoder 'aac' is experimental and might produce bad results2. resize时的参数值必须是偶数3. 增加参数指定处理音频流的方式4. -vf 参数中，iw，ih分别指输出视频的帧宽和帧高5. module 'ffmpeg' has no attribute 'p

2022-02-08 15:44:27 3461

原创 MMAction2框架使用手札

文章目录环境配置部分用法简单记录1. TSM中关于clip_num和clip_length的设置等价性：2. 设置train log打印频率：一些报错 & 原因 & 解决方法：1. 找不到MMCV中某个模块：2. 自定义数据找不到：3. TimeSformer训练时无法load模型：4. 视频解码部分报错：环境配置基础镜像：pytorch/pytorch:1.6.0-cuda10.1-cudnn7-devel依次：apt-get update && apt-get

2022-02-08 15:31:03 4747

原创关于GPU利用率低值得考虑的几个点

【问题】深度学习相关的程序运行时，GPU利用率很低，间隔地达到一下一个较高的值，但大部分时间是0%。【分析】通常是因为GPU在等程度的其他动作，主要就是加载数据和CPU上的一些操作（包括数据预处理等），所以可以按照以下步骤逐一确认瓶颈所在：确认一下CPU利用率是不是很高：top # 查看对应CPU利用率是不是爆满如果CPU利用已经超负荷了，那说明数据预处理等操作的一步可能就已经达到机器上限了，需要考虑CPU性能是不是不太够。更常见的原因是I/O瓶颈，尤其常见的情景是数据存储在机械硬盘上

2021-06-10 10:16:53 5039

原创 python中出现@作为运算符

看Swin Transformer代码的时候发现一个奇怪的用法，之前没有见过： q = q * self.scale attn = (q @ k.transpose(-2, -1))python中@符号一般只在装饰器上用到，但这里用作了运算符并不是很常见。但这其实也是一种运算符，a @ b等同于a.mm(b)或a.matmul(b)，只是并不是很常用，具体可以参照python的官方文档，这里还有一些其他平时不常用到的python运算符。...

2021-04-13 17:46:29 3313 2

原创有监督、半监督、无监督、弱监督、自监督的定义和区别

有监督、半监督、无监督、弱监督、自监督的定义和区别

2021-02-07 10:41:42 41761 4

原创 Docker容器内安装opencv-python

【问题】在docker容器内直接pip安装opencv-python：pip install opencv-python再import cv2时会报错：ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory【解决方法】在容器内不能用上述方法安装，需要先卸载原有的cv2：pip uninstall opencv-python再用一下命令安装即可：pip ins

2021-01-13 19:38:48 2755 3

原创 python import cv2 报错

【问题】python import cv2时报错：ImportError: libSM.so.6: cannot open shared object file: No such file or directoryImportError: libXrender.so.1: cannot open shared object file: No such file or directoryImportError: libXext.so.6: cannot open shared object file:

2021-01-13 19:26:49 1030 1

原创【搬砖心得】Docker容器挂载目录的用户权限问题

问题docker容器挂载目录下部分文件，在容器外没有权限进行移动删除等操作。原因docker容器内与服务器共享同一个linux内核，验证权限时只认uid和gid（相关知识参照https://www.jianshu.com/p/5cca9ab67461），所以不管用户名是什么，对一个特定文件的所有者，容器内外都是只认相应的uid的。启动docker容器时如果不指定用户，则会默认为root用户，如果在容器内对挂载目录下的文件进行了操作，则相应文件的所有者就会升级为root，在容器外如果只有非root用户

2020-10-30 14:38:01 10099

原创 os.makedirs() 和 os.mkdir() 区别

os.makedirs()会自动创建多层路径os.mkdir() 只会创建最底层的路径，上层路径不存在时会报错import ospath = './test/sub_test'os.makedirs(path ) # 当test文件夹不存在时，会自动创建test，并且创建sub_testos.mkdir(path ) # 当test文件夹不存在时，会报错...

2020-10-22 09:44:46 1224 1

原创【论文阅读笔记】Self-training with Noisy Student improves ImageNet classification

Motivation利用较少的标记数据来进一步利用大规模的无标记数据进行半监督/自监督学习用teacher模型生成伪标签训练studen模型，并通过加入噪声使student模型由于teacher模型，迭代此过程以得到更优的模型原理基于self-training的teacher-student框架用标记数据训练teacher模型用teacher模型对大规模的无标记数据生成伪标签用labelled data和具有伪标签的unlabelled data共同训练student模型新的stu

2020-10-21 13:43:15 865

原创【论文阅读笔记】NIMA: Neural Image Assessment

原理分类器输出各个分数的概率值，与GT的打分计算lossloss采用EMDloss这样意味着不是简单的二分类，也不是对得分进行回归，而是让模型去生成对输入图片的得分的分布，并且假设是高斯分布，这样就可以得到均值和方差，用均值作为输入图片美观度的得分模型结构各种baseline CNN + FC + softmaxFC的输出维度由数据集打分的范围决定，例如1-10分则为10个分类重点理解文章的重点主要在于采用了这个EMD函数，之前没见过，需要理解一下CDF是累计分布概率函数，所以能够体

2020-10-09 15:58:20 891 1

原创 LeetCode python刷题笔记

题目（中文）难度求众数简单––

2019-05-27 22:06:35 392

原创 [leetcode刷题python] 求众数

给定一个大小为 n 的数组，找到其中的众数。众数是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的，并且给定的数组总是存在众数。示例 1:输入: [3,2,3]输出: 3示例 2:输入: [2,2,1,1,1,2,2]输出: 2解题思路：满足题干要求的众数若存在，则仅可能存在一个用dict来存储每个数字出现的次数根据出现次数排序判断出现次数最多的...

2019-05-27 22:05:22 461

原创报错记录：‘module‘ object has no attribute ‘compute_ssim‘

pip install pyssim* pip install ssim不管用，得是pyssim

2019-04-15 21:06:47 1087

原创关于牛客网代码题数据读取问题的小白指南

作为一个代码小白，刷题是一件如攀登珠峰一样困难的事情找对登山装备就不是一件简单的事情关于牛客网上代码题的逐行读取数据的方式，居然也困扰了我很久终于在善良同窗的帮助下弄清楚了“套路”在这里分享一下，不是给“熟手”看的，只不过是想拯救一下和我一样小白的“登山者”以python为例，其他语言请参考原理自行触类旁通牛客网官方不靠谱指北：小白要有自知之明，这不适合你，原理更重要lines...

2019-04-13 17:47:06 3072

Spatial Transformer Networks--论文阅读笔记

Spatial Transformer Networks–论文阅读笔记主要思想用一个神经网络来生成仿射变换的变换矩阵，这样就得到一种仿射变换，用于处理数据使得之后用这些数据进行的后续的任务能获得更佳的效果。预备知识：仿射变换关于仿射变换，这个知乎回答我觉得很容易理解了简单理解为线性变换+平移即可在CV中我认为用仿射变换的作用就在于将输入图像中的目标对象进行一个拉...

2018-08-25 22:40:38 462

原创 unsupervised leaning of visual representation using videos-特征表示方法学习笔记

特征表示方法学习笔记unsupervised leaning of visual representation using videos根本思想：用一个图片（patch）三元组（a, b, c）来训练网络，其中a和b是同一个视频中内容相近的patch， c是从其他视频中任意采样得到的patch，让网络能学习到a, b, c的特征并满足a,b之间的距离尽量小，a,c之间...

2018-08-24 22:10:59 1022

原创记录Tensorflow的Cifar10图像分类示例几个错误和注意点

一些因为版本不同引起的问题，报错就google就基本都可以解决，不在此细述。 Tensorflow中文社区·卷积神经网络：http://www.tensorfly.cn/tfdoc/tutorials/deep_cnn.html Cifar10下载地址：http://www.cs.toronto.edu/~kriz/cifar.html 选择其中的python版本即可，下载下来是六个二进...

2018-04-20 10:07:40 552 1

原创一种数据表示方法：One-hot

一篇比较详细的博客： http://blog.youkuaiyun.com/google19890102/article/details/44039761一篇通俗易懂的博客： http://blog.youkuaiyun.com/u010910436/article/details/53762648

2018-03-13 15:54:50 2179

原创一个生成自然场景视频模型的基线

Video（Language）Modeling： A Baseline for Generative Models of Natural Videos从自然语言处理的经典方法中获得启示，例如 n-grams， neural net language models (Bengio et al., 2003) 和recurrent neural networks(Mikolov et al., 201...

2018-02-27 10:18:56 460

原创 video pixel networks阅读笔记

一、模型结构本文定义了一个由VPN(video pixel networks)来执行的概率模型。表示第t帧（i, j）位置上c颜色通道（{R, G, B}）的像素值。通过链式法则将视频似然函数p（x）因式分解，表示为一个条件概率的乘积，在没有独立性假设时也可以用一种容易处理的方式进行建模。确定因子分析中的变量顺序遵从两个准则。第一个是根据数据的特性和对数据的使用来确定；预测视

2017-10-27 21:14:17 1495

原创通过cross convolution networks预测视频

cross convolution networks：cross convolution layer + network 主要目的在于用cross convolution layer能够分层表达图像中的动作。主要思路是，将核解码器学习到的核分别应用到由图像编码器学习到的特征图中。cross convolution layer的提出基础： Motion can ofte

2017-10-27 21:09:06 743

杨辉三角的队列方式输出

杨辉三角的队列方式输出（部分代码） void yanghui(LiQueue *&q) { elemtype x,y; int j=2; x=0; for(j=2;j<=10;j++) { int i=1; while(i<j+2) { deQueue(q,y); enQueue(q,x+y); x=y; if(i>=2&&i<=j+1) printf("%5d ",q->rear->data); i++; } enQueue(q,0); printf("\n"); } } void main() { LiQueue *q; q=(LiQueue *)malloc(sizeof(LiQueue)); InitQueue(q); yanghui(q); }

2015-11-05

python import的包失效

2021-03-01

重装win10失败：安装程序无法使用现有分区，因为系统卷没有达到可用的空间需求

2019-10-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

杨辉三角的队列方式输出

python import的包失效

重装win10失败： 安装程序无法使用现有分区，因为系统卷没有达到可用的空间需求

重装win10失败：安装程序无法使用现有分区，因为系统卷没有达到可用的空间需求