prototype learning

最新推荐文章于 2025-02-09 20:11:35 发布

dkpu59104

最新推荐文章于 2025-02-09 20:11:35 发布

阅读量918

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/MaiYatang/p/4787121.html

版权

本文介绍了一种基于最近邻分类器的原型学习算法，包括LVQ2.1、LVQ3、MLVQ3及DSM等算法的具体实现，并讨论了最小分类误差(MCE)的方法。这些算法主要用于手写字符识别等领域。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

一个d 维的特征向量 x=(x1,x2,...xd)T，属于M个类Ck,k=1,2,...M，在NN分类器中，每个类有nk个prototypes，记为mkj,j=1,2,...nk&&k=1,2,...M。

总体框架

特征向量x判定给离它最近的prototype所在的类，每个prototype的decision region叫做Voroni cell，而所有同类的Voronoi cell形成了这个类的decision region。
基于参数优化来学习这些prototypes，设置了一个energy function(error,risk or loss)，通过最小化这个energy function来optimize the prototypes。

E = \int L x (h (x) | x) p (x) d x

其中

Lx(h(x)|x)是当x通过h(x)分类后的损失函数，p(x)表示pattern space的PDF
在实际中使用的是经验损失函数

E = 1 N \sum n = 1 N L x (h (x n) | x n)

通过对梯度下降使E最小化同时最优化参数

Θ(n+1)=Θ(n)−αn▽E
其中的

αn需要满足一下条件

lim n \to \infty α n = 0

\sum n = 1 \infty α n = \infty

\sum n = 1 \infty α 2 n = \infty

要满足上面3个式子的话，

αn=1n是可行的

符号表示

Pk(x) x判为类别k的概率
Pkj(x) x判为类别k，第j个prototype的概率
C(x) x的类别
dkj(x) x与prototype mkj的距离

原型学习算法

LVQ2.1

对于一个input pattern x，找到离它最近的两个prototypemi和mj，其中mi是x所属的类，且满足下式

m i n (d i d j, d j d i) > 1 - w 1 + 2

其中w是一个窗口的宽度。
那么，可以按下式更新:

m i = m i + α (t) (x - m i)

m j = m j - α (t) (x - m j)

LVQ3

相比于LVQ2.1，新增了当最近的两个prototype都是x所属的类的情况，更新如下：

m k = m k + ε (t) α (t) (x - m k) ， k = i, j

MLVQ3

相比于LVQ3，新增了当最近的两个prototype都不是x所属的类的情况，更新如下：

m k = m k - α (t) (x - m k) ， k = i, j

decision surface mapping(DSM)

比较于前面的LVQ，它没有窗口的概念，仅当距离最近的两个原型且其中距离较小的原型分类错误时才更新，假设mki是正确的但距离较大mrj错误的但距离较小则

m k i = m k i + α (t) (x - m k i)

m r j = m r j - α (t) (x - m r j)

minimum classification error(MCE)

相比于MSE，定义了一个基于判别函数的loss function，通过最小化经验损失来最优化分类器参数，其中判别函数定义为input pattern x 与 genuine class中的最近原型mki的距离的负值

g k (x) = - min j d (x, m k j)

misclassification measure of a pattern from class k is:

当

η趋于正无穷时，可以写成

μ k (x) = - g k (x) + g r (x) ， 其 中 r 是 距 离 x 最 近 的 非 同 类 原 型

将

gk(x)带入\mu_k(x)中，则在1-NN中

μ k (x) = d (x, m k i) - d (x, m r j)

可知，分类正确，则

μk为负；分类错误，则

μk为正
如此，则将损失函数定义为

lk(x)=lk(μk)=11+e−ξμk
在一个training sample set中，经验平均损失为

L 0 = 1 N \sum n = 1 N \sum k = 1 M l k (x n) I (x n \in C k)

其它的原型学习方法还有SAA，DA，MSE，MAXP，在此不再复述

本文主要引自paper Evaluation of prototype learning algorithms for nearest-neighbor classifier in application to handwritten character recognition
本文讲述的内容并不完全正确，如有错误欢迎指点 ^)^

来自为知笔记(Wiz)

转载于:https://www.cnblogs.com/MaiYatang/p/4787121.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。