卷积、卷积矩阵（Convolution matrix）与核（Kernel）

最新推荐文章于 2024-06-23 19:47:04 发布

转载最新推荐文章于 2024-06-23 19:47:04 发布 · 734 阅读

2 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/mtcnn/p/9422730.html

本文介绍了卷积矩阵在图像处理中的应用，包括锐化、模糊、边缘增强等功能，并通过MATLAB示例验证了卷积操作与卷积矩阵的等价性。

在图像处理领域，Kernel = convolution matrix = mask，它们一般都为一个较小的矩阵；
用于：Sharpen，Blur， Edge enhance，Edge detect，Emboss（使凸出；在……上作浮雕图案；装饰）

1. 卷积操作与卷积矩阵的等价性

（1）创建一维信号

N = 100;
s = zeros(N, 1);
k = [20, 45, 70];
a = [2, -1, 1];
s(k) = a;

（2）创建卷积核
```
L = 4;
h = ones(L, 1)/L;
```
（3）使用 matlab 创建 convolution matrix

首先考虑，卷积矩阵的 size，卷积操作conv(h, s) 返回的响应其长度为 L+N-1, 因此：
```
M = N+L-1;
H = sparse(M, N);
e = ones(N, 1)
for i = 0:L-1,
    H = H + spdiags(e*h(i+1), -i, M, N);
end
```

（4）验证二者操作的等价性：

err = H*s - conv(h, s);
max_err = max(abs(err));

2. spy：可视化稀疏矩阵的形式

而不是简单地将稀疏矩阵以一个矩阵的形式显示，显然是因为其规模十分之大，且较为稀疏，不易直观观察。

Kernel (image processing)
8.2. Convolution Matrix

转载于:https://www.cnblogs.com/mtcnn/p/9422730.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30379973

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PyTorch笔记 - Convolution 卷积运算的原理 (3)

AGI

08-10

904

矩阵和矩阵相乘，转换为行向量和列向量相乘，即输入矩阵9个行向量 x kernel的列向量。用原始的矩阵运算来实现二维卷积, 考虑batchsize维度和channel维度, 4维。卷积操作包括5个参数：input、kernel、bias、stride、padding。与输入矩阵尺寸相同，填充kernel为0，计算矩阵相乘，转置卷积。flatten input版本：对比与直接矩阵相乘，torch.reshape() 操作。torch.numel() 操作。操作，多维向量变成1维向量。...

PyTorch笔记 - Convolution卷积运算的原理 (2)

AGI

08-10

455

卷积操作示意图：蓝色是input feature map = 5x5、深蓝色是kernel = 3x3、绿色是output feature map = 3x3、stride是1，pad是0、O = (I-K+2P)/S+1，即(5-3+0)/1+1 = 3

参与评论您还未登录，请先登录后发表或查看评论

View convolution and transpose convolution as matrix multiplication (卷积与转置卷积的矩阵表示)

Arieslady

11-08

1241

主流深度学习软件在进行卷积操作的时候并不是采用我们非常熟悉但是效率底下的双重循环算法，而是将卷积表示为一个由卷积核导出的稀疏矩阵与拉伸成一维的影像向量的矩阵乘积，这样可以充分利用GPU带来并行计算的收益（图1）从图1中可以看出，卷积核导出的矩阵是一个双重块状toeplitz矩阵，称为卷积矩阵。卷积矩阵之所以叫双重块状toeplitz矩阵，是因为1）组成该矩阵的每一个分块矩阵都是toe...

矩阵的卷积核

09-03

最近在看图像处理，卷积运算这一块也查了很多，但是感觉都写的太复杂，我这里简单的写一下卷积到底是一个什么计算过程。假设有一个卷积核h，就一般为3*3的矩阵

卷积神经网络（CNN)一些定义的总结：卷积、池化、滤波器、内核、特征图、输入层、隐藏层……（可能不全面，后续遇到会补充）

w2190623446的博客

01-20

7033

卷积神经网络（CNN)一些定义的总结：卷积、池化、滤波器、内核、特征图、输入层、隐藏层、输出层、激活函数、局部连接

矩阵的卷积核运算（一个简单小例子的讲解）

叶小刀

05-14

2万+

卷积运算：假设有一个卷积核h，就一般为3*3的矩阵：有一个待处理矩阵A：h*A的计算过程分为三步第一步，将卷积核翻转180°，也就是成为了第二步，将卷积核h的中心对准x的第一个元素，然后对应元素相乘后相加，没有元素的地方补0。这样结果Y中的第一个元素值Y11=1*0+2*0+1*0+0*0+0*1+0*2+-1*0+-2*5+-1*6=-16第三步每个元素都像这样计算出来就可以得到一个输出矩阵，就...

[论文学习]Convolutional matrix factorization for document context-aware recommendation

somTian的博客

05-23

7525

翻译论文Convolutional matrix factorization for document context-aware recommendation

矩阵卷积与图像处理.pptx

12-06

矩阵卷积（Matrix Convolution）是一种重要的数学运算，在图像处理、计算机视觉以及深度学习等领域有着广泛的应用。简而言之，矩阵卷积是两个二维数组之间的一种特殊乘法操作，其中一个通常是较大的输入图像或特征图...

【CUDA】 1D卷积 1D Convolution

weixin_68880273的博客

06-23

1961

基本方法、常数存储器、共享存储器和Caching 基本方法在基本方法中，卷积是通过逐次访问数组并为每个元素计算卷积来计算的。这种方法很简单，但效率不高。原因在于卷积操作需要多次访问输入数组和mask (掩膜，卷积核，掩码)。常量存储器为了避免多次访问mask，我们可以将mask的元素存储到常量内存中。这将使硬件能够将mask元素缓存到L2缓存内存中。这将大大减少全局内存访问，并提高kernel的性能。共享存储器共享存储器方法利用共享内存缓存输入数组。由于卷积操作多次访问相同的输入元

Metal每日分享，3x3矩阵卷积滤镜效果

qq_34534179的博客

11-22

684

本案例的目的是理解如何用Metal实现3x3卷积矩阵效果滤镜，取像素点周边九个区域半径点像素rgb值进行矩阵运算获取新的rgb值;

矩阵卷积(matlab函数)

04-29

矩阵卷积原理与实现 function [ hp] = juanji( f,g ) %此函数只为计算两任意二维矩阵的卷积 %命令格式：C=juanji(A,B) C为A B的卷积; %若A为m*n矩阵，B为p*q矩阵，则C为(m+p-1)*(n+q-1)矩阵;

matrix-convolution:矩阵卷积

05-03

ml-矩阵卷积矩阵卷积。安装 npm i ml-matrix-convolution const MatrixConvolution = require ( 'ml-matrix-convolution' ) ; let matrix = [ [ 1 , 1 , 1 , 1 , 1 ] , [ 1 , 1 , 1 , 1 , 1 ] , [ 1 , 1 , 1 , 1 , 1 ] , [ 1 , 1 , 1 , 1 , 1 ] , [ 1 , 1 , 1 , 1 , 1 ] , ] ; let kernel = [ [ 1 , 1 , 1 ] , [ 1 , 1 , 1 ] , [ 1 , 1 , 1 ] , ] ; let conv1 = MatrixConvolution . direct ( matrix , kernel ) ; let co

将卷积运算转换成矩阵相乘

09-13

本程序将一般的卷积运算心矩阵相乘的形式给出，并且可以心大矩阵的形式来显示卷积核的内容。

矩阵卷积运算的具体过程

qwj的博客

07-27

9698

矩阵卷积运算的具体过程，很简单最近在看图像处理，卷积运算这一块也查了很多，但是感觉都写的太复杂，我这里简单的写一下卷积到底是一个什么计算过程。假设有一个卷积核h，就一般为3*3的矩阵：有一个待处理矩阵x： h*x的计算过程分为三步第一步，将卷积核翻转180°，也就是成为了第二步，将卷积核h的中心对准x的第一个元素，然后对应元素相乘后相加，没有元素的地方补0。...

论文解析：Graph Convolutional Matrix Completion

da_kao_la的博客

03-11

2473

论文解析：Graph Convolutional Matrix Completion 作者：Rianne van den Berg, Thomas N. Kipf, Max Welling（也是发表GCN的团队）会议：KDD 2018 方法图变分自编码器(GAE)的应用（GAE的博客），算法核心就是下面的图将推荐系统的user-item交互建模为二分图，user和item分别是二分图的...

卷积矩阵及其运算实例

sumx2015的博客

10-10

7647

矩阵的卷积运算主要用在图像处理中，假设输入信号为x[m,n]，激活响应为h[m,n]，则其卷积定义为：不过在图像处理中这里的激活响应（也称为核）h[m,n]通常是一个3乘3矩阵，其下标如下图所示其余下标的值取0，注意到原点(0,0)是是矩阵的中心。在图像处理中，输入信号x[m,n]的非零值通常是横坐标从0到M-1，纵坐标从0到N-1，这里M和N分别是图像宽和

矩阵卷积

baiyi_canggou的博客

04-20

863

以在图像处理中的应用为例：假设矩阵A、B，A代表源图像，B代表卷积模板（二维卷积）函数给出的形式; 计算过程，将卷积模板旋转180度，然后将模板依次从上到下，从左往右滑动，计算在模板与原图像交集元素的乘积和，作为卷积以后的数值。例：将模板翻转计算过程计算结果 shape的取值有三种，full代表返回卷积以后的全部数据，size为(mA+

卷积的矩阵理解

ArtoriaBB的博客

02-25

6556

卷积是神经中常见的一种操作，人们通常习惯从直觉上理解卷积层的卷积操作。但是在代码实现的时候通常需要更为数学化的卷积表达形式，而且理解卷积的数学形式反过来可以帮助更好地理解卷积操作的本质。卷积的数学形式通常通过矩阵乘法来表示。本文从卷积最一般的数学形式开始讲起，并从一般形式变换为不同网络中的各种特殊形式，最后将说明opencv、tensorflow和pytorch中的卷积的数学形式。 1. 卷积的...

矩阵卷积理解

最新发布

07-07

在卷积神经网络（CNN）中，矩阵乘法是实现卷积操作的核心机制之一。卷积本质上是一种局部加权求和的过程，而通过将卷积操作转化为矩阵乘法，可以更高效地利用现代计算硬件（如GPU）进行加速。 ### 卷积操作的矩阵乘法实现卷积运算可以通过一种称为“im2col”（image to column）的技术转换为矩阵乘法。具体来说，输入特征图中的每个局部感受野区域被展开成一列向量，这些列向量组合在一起形成一个大的输入矩阵。与此同时，卷积核（滤波器）也被展平为一行向量，并堆叠成权重矩阵。最终的输出可以通过对这两个矩阵执行标准的矩阵乘法得到。例如，假设输入特征图大小为 $H \times W \times C_{in}$，卷积核大小为 $K \times K$，数量为 $C_{out}$，步长为 $S$，那么通过 im2col 转换后，输入矩阵的形状将是 $(K^2 \cdot C_{in}) \times (H' \cdot W')$，其中 $H'$ 和 $W'$ 是输出特征图的高度和宽度；而权重矩阵的形状则是 $C_{out} \times (K^2 \cdot C_{in})$。两者相乘后的结果矩阵形状为 $C_{out} \times (H' \cdot W')$，再将其重塑为 $H' \times W' \times C_{out}$ 的张量即为卷积后的输出 [^1]。 ### 矩阵乘法的优势使用矩阵乘法来实现卷积具有以下优势： - **计算效率高**：现代深度学习框架通常优化了矩阵乘法操作，因此将卷积转换为矩阵乘法可以显著提高计算效率。 - **易于并行化**：矩阵乘法非常适合在并行计算设备上执行，如GPU或TPU，从而加速训练和推理过程。 - **内存访问模式友好**：im2col 方法虽然会增加一定的内存占用，但其数据排列方式有助于提升缓存命中率，减少内存带宽瓶颈。 ### 应用场景除了基本的卷积层之外，矩阵乘法还广泛应用于其他与卷积相关的操作中，例如： - **转置卷积（Deconvolution）**：用于图像上采样任务，也可以通过类似的矩阵操作实现。 - **分组卷积（Grouped Convolution）**：将输入通道分成若干组，每组独立进行卷积计算，常用于减少参数量和计算复杂度。 - **深度可分离卷积（Depthwise Separable Convolution）**：先对每个输入通道单独做卷积，然后再进行逐点卷积，进一步降低计算成本。综上所述，矩阵乘法不仅简化了卷积操作的实现，也为后续的各种优化提供了基础。这种转换方法已经成为大多数深度学习框架的标准实践之一。 ```python import numpy as np def im2col(input_data, kernel_h, kernel_w, stride=1, padding=0): """ Convert input image to column matrix for convolution via matrix multiplication. Args: input_data: Input tensor of shape (batch_size, channels, height, width) kernel_h: Kernel height kernel_w: Kernel width stride: Stride value padding: Padding size Returns: col: Column matrix representation of the input data """ N, C, H, W = input_data.shape out_h = (H + 2 * padding - kernel_h) // stride + 1 out_w = (W + 2 * padding - kernel_w) // stride + 1 # Pad input with zeros along spatial dimensions padded_input = np.pad(input_data, ((0, 0), (0, 0), (padding, padding), (padding, padding)), mode='constant') # Initialize output array col = np.zeros((N, C, kernel_h, kernel_w, out_h, out_w)) for y in range(kernel_h): y_max = y + stride * out_h for x in range(kernel_w): x_max = x + stride * out_w col[:, :, y, x, :, :] = padded_input[:, :, y:y_max:stride, x:x_max:stride] # Reshape to column matrix format col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N * out_h * out_w, C * kernel_h * kernel_w) return col ```