- 博客(22)
- 资源 (1)
- 问答 (2)
- 收藏
- 关注
原创 FFmpeg使用手札
文章目录环境搭建1. 快速搭建(不考虑版本兼容)2. 安装ffmpeg-cuda加速3. ffmpeg-python环境搭建一些报错记录 & 原因 & 解决方法1. 报错:encoder 'aac' is experimental and might produce bad results2. resize时的参数值必须是偶数3. 增加参数指定处理音频流的方式4. -vf 参数中,iw,ih分别指输出视频的帧宽和帧高5. module 'ffmpeg' has no attribute 'p
2022-02-08 15:44:27
3346
原创 MMAction2框架使用手札
文章目录环境配置部分用法简单记录1. TSM中关于clip_num和clip_length的设置等价性:2. 设置train log打印频率:一些报错 & 原因 & 解决方法:1. 找不到MMCV中某个模块:2. 自定义数据找不到:3. TimeSformer训练时无法load模型:4. 视频解码部分报错:环境配置基础镜像:pytorch/pytorch:1.6.0-cuda10.1-cudnn7-devel依次:apt-get update && apt-get
2022-02-08 15:31:03
4645
原创 关于GPU利用率低值得考虑的几个点
【问题】深度学习相关的程序运行时,GPU利用率很低,间隔地达到一下一个较高的值,但大部分时间是0%。【分析】通常是因为GPU在等程度的其他动作,主要就是加载数据和CPU上的一些操作(包括数据预处理等),所以可以按照以下步骤逐一确认瓶颈所在:确认一下CPU利用率是不是很高:top # 查看对应CPU利用率是不是爆满如果CPU利用已经超负荷了,那说明数据预处理等操作的一步可能就已经达到机器上限了,需要考虑CPU性能是不是不太够。更常见的原因是I/O瓶颈,尤其常见的情景是数据存储在机械硬盘上
2021-06-10 10:16:53
4836
原创 python中出现@作为运算符
看Swin Transformer代码的时候发现一个奇怪的用法,之前没有见过: q = q * self.scale attn = (q @ k.transpose(-2, -1))python中@符号一般只在装饰器上用到,但这里用作了运算符并不是很常见。但这其实也是一种运算符,a @ b等同于a.mm(b)或a.matmul(b),只是并不是很常用,具体可以参照python的官方文档,这里还有一些其他平时不常用到的python运算符。...
2021-04-13 17:46:29
3188
2
原创 Docker容器内安装opencv-python
【问题】在docker容器内直接pip安装opencv-python:pip install opencv-python再import cv2时会报错:ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory【解决方法】在容器内不能用上述方法安装,需要先卸载原有的cv2:pip uninstall opencv-python再用一下命令安装即可:pip ins
2021-01-13 19:38:48
2677
3
原创 python import cv2 报错
【问题】python import cv2时报错:ImportError: libSM.so.6: cannot open shared object file: No such file or directoryImportError: libXrender.so.1: cannot open shared object file: No such file or directoryImportError: libXext.so.6: cannot open shared object file:
2021-01-13 19:26:49
990
1
原创 【搬砖心得】Docker容器挂载目录的用户权限问题
问题docker容器挂载目录下部分文件,在容器外没有权限进行移动删除等操作。原因docker容器内与服务器共享同一个linux内核,验证权限时只认uid和gid(相关知识参照https://www.jianshu.com/p/5cca9ab67461),所以不管用户名是什么,对一个特定文件的所有者,容器内外都是只认相应的uid的。启动docker容器时如果不指定用户,则会默认为root用户,如果在容器内对挂载目录下的文件进行了操作,则相应文件的所有者就会升级为root,在容器外如果只有非root用户
2020-10-30 14:38:01
9618
原创 os.makedirs() 和 os.mkdir() 区别
os.makedirs()会自动创建多层路径os.mkdir() 只会创建最底层的路径,上层路径不存在时会报错import ospath = './test/sub_test'os.makedirs(path ) # 当test文件夹不存在时,会自动创建test,并且创建sub_testos.mkdir(path ) # 当test文件夹不存在时,会报错...
2020-10-22 09:44:46
1161
1
原创 【论文阅读笔记】Self-training with Noisy Student improves ImageNet classification
Motivation利用较少的标记数据来进一步利用大规模的无标记数据进行半监督/自监督学习用teacher模型生成伪标签训练studen模型,并通过加入噪声使student模型由于teacher模型,迭代此过程以得到更优的模型原理基于self-training的teacher-student框架用标记数据训练teacher模型用teacher模型对大规模的无标记数据生成伪标签用labelled data和具有伪标签的unlabelled data共同训练student模型新的stu
2020-10-21 13:43:15
780
原创 【论文阅读笔记】NIMA: Neural Image Assessment
原理分类器输出各个分数的概率值,与GT的打分计算lossloss采用EMDloss这样意味着不是简单的二分类,也不是对得分进行回归,而是让模型去生成对输入图片的得分的分布,并且假设是高斯分布,这样就可以得到均值和方差,用均值作为输入图片美观度的得分模型结构各种baseline CNN + FC + softmaxFC的输出维度由数据集打分的范围决定,例如1-10分则为10个分类重点理解文章的重点主要在于采用了这个EMD函数,之前没见过,需要理解一下CDF是累计分布概率函数,所以能够体
2020-10-09 15:58:20
789
1
原创 [leetcode刷题python] 求众数
给定一个大小为 n 的数组,找到其中的众数。众数是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的,并且给定的数组总是存在众数。示例 1:输入: [3,2,3]输出: 3示例 2:输入: [2,2,1,1,1,2,2]输出: 2解题思路:满足题干要求的众数若存在,则仅可能存在一个用dict来存储每个数字出现的次数根据出现次数排序判断出现次数最多的...
2019-05-27 22:05:22
423
原创 报错记录:‘module‘ object has no attribute ‘compute_ssim‘
pip install pyssim* pip install ssim不管用,得是pyssim
2019-04-15 21:06:47
1057
原创 关于牛客网代码题 数据读取问题的 小白指南
作为一个代码小白,刷题是一件如攀登珠峰一样困难的事情找对登山装备就不是一件简单的事情关于牛客网上代码题的逐行读取数据的方式,居然也困扰了我很久终于在善良同窗的帮助下弄清楚了“套路”在这里分享一下,不是给“熟手”看的,只不过是想拯救一下和我一样小白的“登山者”以python为例,其他语言请参考原理自行 触类旁通牛客网官方不靠谱指北:小白要有自知之明,这不适合你,原理更重要lines...
2019-04-13 17:47:06
2944
Spatial Transformer Networks--论文阅读笔记
Spatial Transformer Networks–论文阅读笔记主要思想用一个神经网络来生成仿射变换的变换矩阵,这样就得到一种仿射变换,用于处理数据使得之后用这些数据进行的后续的任务能获得更佳的效果。预备知识:仿射变换关于仿射变换,这个知乎回答我觉得很容易理解了 简单理解为 线性变换+平移 即可 在CV中我认为用仿射变换的作用就在于将输入图像中的目标对象进行一个拉...
2018-08-25 22:40:38
427
原创 unsupervised leaning of visual representation using videos-特征表示方法 学习笔记
特征表示方法 学习笔记unsupervised leaning of visual representation using videos根本思想:用一个图片(patch)三元组(a, b, c)来训练网络, 其中a和b是同一个视频中内容相近的patch, c是从其他视频中任意采样得到的patch, 让网络能学习到a, b, c的特征并满足a,b之间的距离尽量小,a,c之间...
2018-08-24 22:10:59
975
原创 记录Tensorflow的Cifar10图像分类示例几个错误和注意点
一些因为版本不同引起的问题,报错就google就基本都可以解决,不在此细述。 Tensorflow中文社区·卷积神经网络:http://www.tensorfly.cn/tfdoc/tutorials/deep_cnn.html Cifar10下载地址:http://www.cs.toronto.edu/~kriz/cifar.html 选择其中的python版本即可,下载下来是六个二进...
2018-04-20 10:07:40
528
1
原创 一种数据表示方法:One-hot
一篇比较详细的博客: http://blog.youkuaiyun.com/google19890102/article/details/44039761一篇通俗易懂的博客: http://blog.youkuaiyun.com/u010910436/article/details/53762648
2018-03-13 15:54:50
2140
原创 一个生成自然场景视频模型的基线
Video(Language)Modeling: A Baseline for Generative Models of Natural Videos从自然语言处理的经典方法中获得启示,例如 n-grams, neural net language models (Bengio et al., 2003) 和recurrent neural networks(Mikolov et al., 201...
2018-02-27 10:18:56
416
原创 video pixel networks阅读笔记
一、模型结构本文定义了一个由VPN(video pixel networks)来执行的概率模型。 表示第t帧(i, j)位置上c颜色通道({R, G, B})的像素值。通过链式法则将视频似然函数p(x)因式分解,表示为一个条件概率的乘积,在没有独立性假设时也可以用一种容易处理的方式进行建模。确定因子分析中的变量顺序遵从两个准则。第一个是根据数据的特性和对数据的使用来确定;预测视
2017-10-27 21:14:17
1450
原创 通过cross convolution networks预测视频
cross convolution networks:cross convolution layer + network 主要目的在于用cross convolution layer能够分层表达图像中的动作。主要思路是,将核解码器学习到的核分别应用到由图像编码器学习到的特征图中。cross convolution layer的提出基础: Motion can ofte
2017-10-27 21:09:06
688
杨辉三角的队列方式输出
2015-11-05
python import的包失效
2021-03-01
重装win10失败: 安装程序无法使用现有分区,因为系统卷没有达到可用的空间需求
2019-10-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人