
~~~计算机视觉~~~
文章平均质量分 54
NANCYGOODENOUGH
这个作者很懒,什么都没留下…
展开
-
npy格式的文件生成图像展示
import numpy as npimport cv2import matplotlib.pyplot as pltimage = np.load("/root/userfolder/Dataset/LR_T1_T_3X_29.npy")for i in range(0,image.shape[0]): plt.imshow(image[i,:,:]) cv2.imwrite(str(i)+".png",image[i,:,:]) plt.show()【注意】pyt.原创 2021-11-25 19:50:43 · 1944 阅读 · 0 评论 -
NumPy IO
Numpy 可以读写磁盘上的文本数据或二进制数据。NumPy 为 ndarray 对象引入了一个简单的文件格式:npy。npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。常用的 IO 函数有:load() 和 save() 函数是读写文件数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。 savez() 函数用于将多个数组写入文件,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npz 的文件转载 2021-11-25 15:39:27 · 101 阅读 · 0 评论 -
2021-11-12-MLP
多层感知器MLP的基本结构最典型的MLP包括包括三层:输入层、隐层和输出层,MLP神经网络不同层之间是全连接的(全连接的意思就是:上一层的任何一个神经元与下一层的所有神经元都有连接)。由此可知,神经网络主要有三个基本要素:权重、偏置和激活函数权重:神经元之间的连接强度由权重表示,权重的大小表示可能性的大小偏置:偏置的设置是为了正确分类样本,是模型中一个重要的参数,即保证通过输入算出的输出值不能随便激活。激活函数:起非线性映射的作用,其可将神经元的输出幅度限制在一定范围内,一般..转载 2021-11-12 15:22:19 · 661 阅读 · 0 评论 -
2021-11-10-Codebook理解
《Deep Visual-Semantic Quantization for Efficient Image Retrieval》中提到的codebook是什么意思?Specifically, each image embedding zn is quantized using a set of M codebooks C = [C1, . . . , CM ], each codebook Cm contains K codewords Cm = [Cm1, . . . , CmK], and eac转载 2021-11-10 22:31:40 · 3274 阅读 · 0 评论 -
2021-11-10-嵌入(embedding)层的理解
首先,我们有一个one-hot编码的概念。假设,我们中文,一共只有10个字。。。只是假设啊,那么我们用0-9就可以表示完比如,这十个字就是“我从哪里来,要到何处去”其分别对应“0-9”,如下:我 从 哪 里 来 要 到 何 处 去0 1 2 3 4 5 6 7 8 9那么,其实我们只用一个列表就能表示所有的对话如:我 从 哪 里 来 要 到 何 处 去 ——>>>[0 1 2 ...转载 2021-11-10 22:22:21 · 858 阅读 · 0 评论 -
5-24-什么是meta-learning?
转载 2021-05-24 15:00:57 · 120 阅读 · 0 评论 -
3-15- 什么是meta path
Meta Path 是2011年 Yizhou Sun etc. 提出的 http://www.morganclaypool.com/doi/abs/10.2200/S00433ED1V01Y201207DMK005, 针对异质网络中的相似性搜索。Meta Path 是一条包含relation序列的路径,而这些 relation 定义在不同类型object之间。...原创 2021-03-15 20:20:53 · 848 阅读 · 0 评论 -
3-15-为什么会出现图卷积神经网络?
转载 2021-03-15 16:28:33 · 199 阅读 · 0 评论 -
3-6-多平面图像Multiplane image是什么?
图像处理的alpha通道(RGBA图像)原文链接:https://blog.youkuaiyun.com/Joseph__Lagrange/article/details/109499269Alpha通道的概念与功能在计算机图形学中,一个RGB颜色模型的真彩图形,用由红、绿、蓝三个色彩信息通道合成的,每个通道用了8位色彩深度,共计24位,包含了所有彩色信息。为实现图形的透明效果,采取在图形文件的处理与存储中附加上另一个8位信息的方法,这个附加的代表图形中各个像素点透明度的通道信息就被叫做Alpha通道。..转载 2021-03-06 20:36:55 · 4298 阅读 · 0 评论 -
3-3- A Memory-Augmented Self-Supervised Tracker(CVPR2020)有代码
loss上改进:原创 2021-03-03 17:43:42 · 189 阅读 · 1 评论 -
2-5-卷积操作的平移不变性
本文链接:https://blog.youkuaiyun.com/m0_47183379/article/details/108910560不变性意味着它的外观发生了一定变化但是你仍能够识别出来。这对图像分类来说是一种很好的特性,因为我们希望图像中目标无论是被平移,被旋转,还是被缩放,甚至是不同的光照条件、视角,都可以被成功地识别出来。比如对图像分类任务来说,图像中的目标不管被移动到图片的哪个位置,得到的结果(标签)应该是相同的,这就是卷积神经网络中的平移不变性。在神经网络中,卷积被定义为不同位置的特征检测器,也就转载 2021-02-05 19:52:13 · 1077 阅读 · 0 评论 -
2-3-Transformer各层网络结构详解!
文章目录 1. 什么是Transformer 2. Transformer结构 2.1 总体结构 2.2 Encoder层结构 2.2.1 Positional Encoding 2.2.2 Self-Attention 2.2.3 Multi-Headed Attention 2.2.4 Layer normalization 2.2.5 Feed Forward Neural Network 2.3 Decoder层结转载 2021-02-03 10:19:42 · 4295 阅读 · 1 评论 -
1-30-什么是遗传算法Genetic Algorithm
01 什么是遗传算法?遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索。其中,选择、交叉转载 2021-02-01 23:22:03 · 1304 阅读 · 0 评论 -
2021-01-29-HAT_Hardware-Aware Transformers for efficient natural language processing(ACL2020)有代码
参考文章https://blog.youkuaiyun.com/qq_28385535/article/details/108006776https://blog.youkuaiyun.com/c9Yv2cf9I06K2A9E/article/details/108030485?utm_medium=distribute.pc_relevant.none-task-blog-searchFromBaidu-5.control&depth_1-utm_source=distribute.pc_relevant.non翻译 2021-01-29 17:31:37 · 121 阅读 · 0 评论 -
1-28-NAT: Neural Architecture Transformer for Accurate and Compact Architectures(NIPS2019)有代码
代码链接 https://github.com/guoyongcs/NAT现有的深度神经网络结构要么是人工设计的(基于人工设计的网络结构的局限性:设计有效的神经网络结构在很大程度上依赖于大量的人类专业知识。此外,人类的设计过程不能充分利用整个结构空间,因此设计的网络结构可能不是最优的),要么是通过神经网络结构搜索 (NAS) 方法自动搜索得到的(基于NAS搜索到的网络结构的局限性:由于存在非常大的搜索空间这些方法通常产生次优架构,导致有限的表示性能或巨大的计算成本)。因此,即使对于设计良好的模型,优化其原创 2021-01-28 23:02:32 · 330 阅读 · 0 评论 -
2021-1-26-理解图像分布
第一种理解 图像的分布归根结底是像素值服从某种分布。比如在用贝叶斯做语义分割中,假设有图像中有三种类别需要分割,可以分别假设属于这三种类别的像素值分别服从三个对应的分布。假设都是高斯分布,如下图所示。在一张图片中,属于类别1的像素都是从分布1中采样得到的,同理属于类别2和3的像素分别是从分布2和3中采样得到的。我们通过给定的ground truth来计算出三个分布的参数,即三个高斯分布的均值和方差。然后在用模型做预测的时候,当拿到一张新的图片,我们从第一个像素开始,分别代入三个分布然后计算后验.转载 2021-01-26 20:59:22 · 4529 阅读 · 0 评论 -
10/6 随机游走 random walk是什么?
随机游走(Random Walk,缩写为 RW),是一种数学统计模型,它是一连串的轨迹所组成。其中每一次都是随机的。它能用来表示不规则的变动形式,如同一个人酒后乱步,所形成的随机过程记录。在图中,具体就是从一个顶点出发,然后按照一定的概率随机移动到一个邻居节点,并将该节点作为新的当前节点,如此循环执行若干步,得到一条游走路径。然后把这个路径视为一个“句子”,用word2vec得到嵌入嵌入结果。核心概念:任何无规则行走者所带的守恒量都各自对应着一个扩散运输定律。...翻译 2020-10-06 09:00:29 · 1865 阅读 · 0 评论 -
9/17 图像语义分割
CNN的强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些局部区域的特征; 较深的卷积层具有较大的感知域,能够学习到更加抽象一些的特征。这些抽象特征对物体的大小、位置和方向等敏感性更低,从而有助于分类性能的提高。这些抽象的特征对分类很有帮助,可以很好地判断出一幅图像中包含什么类别的物体。图像分类是图像级别的!语义分割需要判断图像每个像素点的类别,进行精确分割。图像语义分割是像素级别的!但是由于CNN在进行convolution和pooling翻译 2020-09-17 10:54:54 · 145 阅读 · 0 评论 -
9/17 Dual learning
深度学习之所以取得成功,一个非常重要的因素是大数据(大规模的带标签的数据)首先,人工标注获取标签的代价很高。其次,在很多任务中,我们没办法收集到大规模的标注数据,例如在医疗中。为了使深度学习能够取得更广泛的成功,我们需要降低其对大规模标注数据的依赖性。为了解决这个问题,我们提出了一种新的学习范式,我们把它称作对偶学习。很多人工智能的应用涉及两个互为对偶的任务,例如机器翻译中从中文到英文翻译和从英文到中文的翻译互为对偶、这些互为对偶的人工智能任务可以形成一个闭环,使从没有标注的数据中进行学习.转载 2020-09-17 09:58:06 · 1076 阅读 · 0 评论 -
8/4 奈奎斯特采样定理(香农采样定理)
解释 采样率 和 所测信号频率 之间的关系翻译 2020-08-07 20:29:47 · 1756 阅读 · 0 评论 -
8/3 Parzen 窗 Matlab实现
1. 一维高斯函数密度函数估计close all;clear all;X = normrnd(0,1,1,10000);%从正态分布中产生10000个均值为0,方差为1 的样本f = -3:0.01:3;%确定横坐标范围function p = Parzen(X,h_1,N,x)% X 是所有的样本% h 是Parzen窗的窗口大小% N 是采样的总样本大小% x 是密度估计的点% 采用高斯窗口大小p = zeros(length(x),1); h = (h_1/s.翻译 2020-08-03 10:24:01 · 1235 阅读 · 0 评论 -
8/3 MATLAB绘制正态分布概率密度函数(normpdf)图形
本文首先给出正态分布概率密度函数(The normal distribution probability density function)的公式和标准正态分布概率密度函数的公式,然后通过normpdf( )生成标准正态分布概率密度函数的数据,然后通过plot( )绘制标准正态分布概率密度函数的图形。工具/原料 MATLAB normpdf mean standard deviation 方法/步骤 第一,正态分布概率密度函数的公式如下图。其中,μ为平均转载 2020-08-03 10:16:19 · 11498 阅读 · 0 评论 -
8/3 meshgrid
翻译 2020-08-03 10:09:23 · 118 阅读 · 0 评论 -
8/2 matlab 中绘制二维颜色图表示z轴
翻译 2020-08-02 17:04:35 · 8817 阅读 · 0 评论 -
8/2 图像梯度
清晰图像和模糊图像之间的差别在哪里呢?图像模糊是因为图像中物体的轮廓不明显,轮廓边缘灰度变化不强烈,层次感不强造成的,轮廓边缘灰度变化明显些,层次感强些是不是图像就更清晰些呢。那么,这种灰度变化明显不明显怎样去定义呢。我们学过微积分,知道微分就是求函数的变化率,即导数(梯度),那么对于图像来说,可不可以用微分来表示图像灰度的变化率呢,当然是可以的,前面我们提到过,图像就是函数嘛。如果相邻像素灰度值有变化,那么梯度就有值,如果相邻像素灰度值没有变化,那么梯度就为0。如果我们把梯度值与对翻译 2020-08-02 09:37:06 · 237 阅读 · 0 评论 -
7/30 形态学转化 图像梯度 梯度运算 python+opencv 图像处理
转载 2020-07-30 09:34:16 · 162 阅读 · 0 评论 -
7/29 卷积 局部加权平均
翻译 2020-07-27 16:31:46 · 438 阅读 · 0 评论 -
7/26 什么是K-SVD
K-SVD我们一般是用在字典学习、稀疏编码方面K-SVD的目标是要构造一个过完备的矩阵,然后选择最稀疏的系数解使得矩阵可以对其训练集相似的目标向量进行稀疏表示。翻译 2020-07-26 21:00:15 · 169 阅读 · 0 评论 -
6/25 计算机视觉中的注意力机制
01注意力机制(attention mechanism)attention机制可以它认为是一种资源分配的机制,可以理解为对于原本平均分配的资源根据attention对象的重要程度重新分配资源,重要的单位就多分一点,不重要或者不好的单位就少分一点,在深度神经网络的结构设计中,attention所要分配的资源基本上就是权重了视觉注意力分为几种,核心思想是基于原有的数据找到其之间的关联性,然后突出其某些重要特征,有通道注意力,像素注意力,多阶注意力等02自注意力(self-attention)翻译 2020-06-25 23:14:54 · 1212 阅读 · 0 评论 -
6/25 Yann Lecun:计算机视觉的未来是自监督学习
https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247518600&idx=1&sn=1f84a3068a5ea691a8060fdd4c14fa5e&chksm=96f0fbdca18772ca5ecaadcd22fabc0c1d6a8b130bd065f04ab68b84d8fdb4a62dab26442663&mpshare=1&scene=1&srcid=&sharer_sh原创 2020-06-25 19:41:32 · 315 阅读 · 0 评论 -
5/11 长尾分布数据
实际中,存在大量的长尾分布数据,也就是少数类别有大部分数据,而多数类别只有小部分数据翻译 2020-05-11 10:12:37 · 1154 阅读 · 0 评论