我参考的论文是《The Laplacian Pyramid as a Compact Image Code》, 论文本身,我个人认为讲得不是特别的清楚:1)没有讲为什么the dimensions of the original image is appropriate for pyramid construction if integers MC,MR, and N exist such that Column=MC*2^N+1,Row=MR*2^N+1.这就导致了后面根本就不能理解为什么expand operation 只能使上层的图像(M+1) BY (N+1)扩展为(2M+1) BY (2*N+1);2)weight function 的构建,其实我不是特别明白这个高斯卷积核是如何构造出来的,我参看了其余的代码,发现w=kron(h,h')。其实我一开始的构思是w=h*h',如果是相乘的话,是可以证明A和w卷积等价于A依次和按列与h,按行与h'进行卷积,或许这部分的原理在于论文《Fast filter transforms for image processing》,但是没有下载权限,也是很迷。
说了这么多,其实构建金字塔的主要操作在于reduce和expand,这两个操作。reduce操作非常简单,只需要在图像卷积后保留处理后图像的偶数的行与列即可res=I(1:2:end,1:2:end)。
这里参考的公式即
gl(i,j)=∑2m=−2∑2