【图形图像】几何不变矩---Hu矩

本文介绍了Hu矩的概念,这是一种用于图像识别的几何不变矩,具有旋转、缩放和平移不变性。虽然Hu矩在识别速度上较快,但识别率较低,适用于识别形状简单的物体如水果或车牌字符。文章提供了C++代码实现,用于计算图像的Hu矩。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在连续情况下,图像函数为 ,那么图像的p+q阶几何矩(标准矩)定义为:

 

p+q阶中心距定义为:

 

其中 和 代表图像的重心,

对于离散的数字图像,采用求和号代替积分:

 

 

 和 分别是图像的高度和宽度;

归一化的中心距定义为:

 ;其中

利用二阶和三阶归一化中心矩构造了7个不变矩 :

 

这7个不变矩构成一组特征量,Hu.M.K在1962年证明了他们具有旋转,缩放和平移不变性。

实际上,在对图片中物体的识别过程中,只有 和 不变性保持的比较好,其他的几个不变矩带来的误差比较大,有学者认为只有基于二阶矩的不变矩对二维物体的描述才是真正的具有旋转、缩放和平移不变性( 和 刚好都是由二阶矩组成的)。不过我没有证明是否是真的事这样的。

由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低,我做过手势识别,对于已经分割好的手势轮廓图,识别率也就30%左右,对于纹理比较丰富的图片,识别率更是不堪入眼,只有10%左右。这一部分原因是由于Hu不变矩只用到低阶矩(最多也就用到三阶矩),对于图像的细节未能很好的描述出来,导致对图像的描述不够完整。

Hu不变矩一般用来识别图像中大的物体,对于物体的形状描述得比较好,图像的纹理特征不能太复杂,像识别水果的形状,或者对于车牌中的简单字符的识别效果会相对好一些。

C++代码:

[cpp]  view plain   copy
  1. // 图像位数对齐   
  2.   
  3. #define bpl(imwidth, deep) ((imwidth*deep*8+31)/32*4)   
  4.   
  5. /* 获取像素值  
  6.  
  7. psrcBmp: 图像数据指针  
  8.  
  9. nsrcBmpWidth: 图像宽度,以像素为单位  
  10.  
  11. x,y: 像素点  
  12.  
  13. deep: 图像的位数深度,(表示位的灰度图,表示位的 RGB 位图)  
  14.  
  15. */   
  16.   
  17. COLORREF J_getpixel( const BYTE *psrcBmp, const int nsrcBmpWidth, const int x, const int y, int deep = 3)   
  18.   
  19. {   
  20.   
  21.     if (deep == 3)   
  22.   
  23.     {   
  24.   
  25.         return RGB(*(psrcBmp + x*3 + y*bpl(nsrcBmpWidth, deep) + 2 ) ,   <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值