61、视觉概念学习与信号去噪技术解析

视觉概念学习与信号去噪技术解析

1. 基于视觉基元的学习方法

在视觉学习领域,一种创新的方法是从光栅图像中抽象出来,使用视觉基元(Visual Primitives,VPs)作为视觉信息的基本颗粒。在学习过程之前,输入图像需要进行适当的预处理,将其转换为视觉基元表示(Visual Primitives Representation,VPR)。每个VP由四个标量属性描述:x坐标、y坐标、方向和强度。

具体操作步骤如下:
1. 提取VPs :使用具有四个不同方向α(0°、45°、90°和135°)的Gabor滤波器从单色输入图像中提取VPs。在α - Gabor滤波器响应中,位置(x, y)处的局部最大值会产生一个VP p = (x, y, α)。
2. 限制VPs数量 :为了限制VPR中VPs的数量,只考虑Gabor滤波器响应中最亮像素的预定义β - 百分位数。同时,同一方向的两个VPs之间的距离不能小于预定义的距离dmin。

得到的VPR通常比原始图像紧凑几个数量级。例如,当β = 0.05和dmin = 4时,VPR能够有效地表示图像信息。

这种方法在视觉学习中采用了遗传编程(Genetic Programming,GP)的变体。为了遵循最少承诺原则,允许GP表达式/树直接处理VPs集合,而不仅仅是从它们派生的预定义标量特征。使用了具有三种基本类型的类型化GP:标量(ℜ)、VPs集合(P)和属性标签(A)。

GP节点分为终端节点和非终端节点:
- 终端节点 :分别产生临时随机常数、输入图像z的VP

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值