MATLAB conv2卷积的实现

本文详细介绍了二维卷积算法的基本原理,并提供了一种原始实现方案的代码示例,该方案针对不同形状参数进行了讨论,同时对比了其与MATLAB内置函数的性能。

二维卷积的算法原理比较简单,参考任意一本数字信号处理的书籍,而matlab的conv2函数的滤波有个形状参数,用下面的一张图很能说明问题:


这里给出一种最原始的实现方案。这种实现对于数据矩阵大小为1000x1000,卷积核矩阵大小为20x20,在我的机器上需要大约1秒钟的时间,而matlab采用的MKL库最快只需要将近0.1s的时间。下面的代码用到了自己目前开发的FastIV中的一些函数接口。具体代码如下:

#include "fiv_core.h"

typedef enum{
	FIV_CONV2_SHAPE_FULL,
	FIV_CONV2_SHAPE_SAME,
	FIV_CONV2_SHAPE_VALID
}FIV_CONV_SHAPE;


void fIv_conv2(fIvMat** dst_mat, fIvMat* src_mat, fIvMat* kernel_mat, FIV_CONV_SHAPE shape)
{
	int src_row = src_mat->rows;
	int src_cols = src_mat->cols;
	int kernel_row = kernel_mat->rows;
	int kernel_cols = kernel_mat->cols;
	int dst_row = 0, dst_cols = 0, edge_row = 0, edge_cols = 0;
	int i,j, kernel_i,kernel_j,src_i,src_j;
	fIvMat* ptr_dst_mat = NULL;
	
	switch(shape){
		case FIV_CONV2_SHAPE_FULL:	
			
			dst_row = src_row + kernel_row - 1;
			dst_cols = src_cols + kernel_cols - 1;		
			edge_row = kernel_row - 1;
			edge_cols = kernel_cols - 1;
			break;
			
		case FIV_CONV2_SHAPE_SAME:
			
			dst_row = src_row;
			dst_cols = src_cols;
			edge_row = (kernel_row - 1) / 2;
			edge_cols = (kernel_cols - 1) / 2;
			break;
			
		case FIV_CONV2_SHAPE_VALID:
			
			dst_row = src_row - kernel_row + 1;
			dst_cols = src_cols - kernel_cols + 1;
			edge_row = edge_cols = 0;
			break;
			
	}
	
	ptr_dst_mat = fIv_create_mat(dst_row, dst_cols, FIV_64FC1);
	*dst_mat = ptr_dst_mat;
	
	for (i = 0; i < dst_row; i++) {	
		ivf64* ptr_dst_line_i = (ivf64* )fIv_get_mat_data_at_row(ptr_dst_mat, i);	
		for (j = 0; j < dst_cols; j++) {		
			ivf64 sum = 0;
			
			kernel_i = kernel_row - 1 - FIV_MAX(0, edge_row - i);
			src_i = FIV_MAX(0, i - edge_row);
			
			for (; kernel_i >= 0 && src_i < src_row; kernel_i--, src_i++) {
				
				ivf64* ptr_src_line_i,*ptr_kernel_line_i;
				
				kernel_j = kernel_cols - 1 - FIV_MAX(0, edge_cols - j);
				src_j = FIV_MAX(0, j - edge_cols);
				
				ptr_src_line_i = (ivf64*)fIv_get_mat_data_at_row(src_mat, src_i);
				ptr_kernel_line_i = (ivf64*)fIv_get_mat_data_at_row(kernel_mat, kernel_i);
				
				ptr_src_line_i += src_j;
				ptr_kernel_line_i += kernel_j;
				
				for (; kernel_j >= 0 && src_j < src_cols; kernel_j--, src_j++){
					sum += *ptr_src_line_i++ * *ptr_kernel_line_i--;
					}
			}			
			ptr_dst_line_i[j] = sum;
		}
	}
}


FIV_ALIGNED(16) ivf64 ker_data[4*4] = {0.1,0.2,0.3,0.4,
									   0.5,0.6,0.7,0.8,
									   0.9,1.0,1.1,1.2,
									   1.3,1.4,1.5,1.6};



void test_conv2()
{
	fIvMat* src_mat = fIv_create_mat_magic(8, FIV_64FC1); // 8x8 magic matrix
	fIvMat* kernel_mat = fIv_create_mat_header(4, 4, FIV_64FC1);

	fIvMat* dst_mat = NULL;
	fIv_set_mat_data(kernel_mat, ker_data, (sizeof(ivf64)) * 4 * 4);

	fIv_conv2(&dst_mat, src_mat, kernel_mat, FIV_CONV2_SHAPE_FULL);

	fIv_export_matrix_data_file(dst_mat,"dst_mat_4x4-full.txt", 1);


	fIv_release_mat(&src_mat);
	fIv_release_mat(&kernel_mat);
	fIv_release_mat(&dst_mat);



}

int main()
{
	test_conv2();

	return 0;
}

 10月24日更新:

目前FastIV中的实现已经经过优化,最快速度在我的机器上已经超越MATLAB。


### MATLABconv2函数的卷积滑动方式设置 在MATLAB中,`conv2` 函数用于计算两个二维数组之间的卷积。其滑动方式主要通过参数 `shape` 来控制输出结果的大小和内容。具体来说,`shape` 参数可以取以下三种值:`'full'`、`'same'` 和 `'valid'`。以下是每种滑动方式的具体含义和实现机制: 1. **`'full'` 模式** 当 `shape='full'` 时,返回完整的二维卷积结果。这意味着卷积核会覆盖输入图像的所有可能位置,包括边界补零的部分。输出矩阵的大小为 `(ma + mb - 1) x (na + nb - 1)`,其中 `ma x na` 是输入图像的大小,`mb x nb` 是卷积核的大小[^1]。 2. **`'same'` 模式** 当 `shape='same'` 时,返回与输入图像相同大小的卷积结果。具体实现是提取卷积结果的中心部分,使得输出矩阵的大小与输入图像一致。这种模式通常用于保持图像尺寸不变的情况。 3. **`'valid'` 模式** 当 `shape='valid'` 时,仅返回不包含任何边界补零部分的卷积结果。这意味着只有那些完全由输入图像元素(而非补零元素)参与计算的部分才会被保留。输出矩阵的大小为 `(ma - mb + 1) x (na - nb + 1)`,前提是 `size(A) > size(B)`。 #### 示例代码 以下是一个具体的示例,展示如何在 MATLAB 中设置 `conv2` 的滑动方式: ```matlab % 输入图像 A 和卷积核 B A = [4 3 1 2; 0 1 1 3; 5 2 0 0]; B = [1 2 3; 0 -1 2; 1 1 0]; % 使用 'full' 模式 C_full = conv2(A, B, 'full'); disp('Full convolution result:'); disp(C_full); % 使用 'same' 模式 C_same = conv2(A, B, 'same'); disp('Same convolution result:'); disp(C_same); % 使用 'valid' 模式 C_valid = conv2(A, B, 'valid'); disp('Valid convolution result:'); disp(C_valid); ``` #### 输出解释 - 在 `'full'` 模式下,输出矩阵会包含所有可能的卷积结果,包括边界补零的影响。 - 在 `'same'` 模式下,输出矩阵大小与输入图像一致,仅保留中心部分的结果。 - 在 `'valid'` 模式下,输出矩阵仅包含未受边界补零影响的部分,确保结果的纯净性。 ### 注意事项 - 卷积核在计算过程中会被旋转 180 度。 - 输入图像会在边界处自动补零,以适应卷积核的滑动操作[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值