神经网络 习题(推广的LVQ).

本文针对推广的LVQ算法,提出了一种新的学习算法,并详细推导了其计算过程。该算法利用KL差最小化作为优化目标,适用于带有标定及未标定数据集的模式分类任务。通过实验探讨了超参数g和a对分类性能的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

习题(推广的LVQ).

设竞争网络的底层为输入源节点,竞争层的神经元y和底层源节点j的连接权值为wyj。对于C类分类问题,每个竞争神经元属于类别c的概率为

P(yÎc)=exp(acy)/(åcexp(acy)),c=1,2,…C.

那么输入向量x,它的属于类别c的概率为

P(xÎc)=åyP(yÎc)P(y|x),c=1,2,…C.

其中使用最简单的假设

P(y|x)=exp(-g||wy-x||2)/(åyexp(-g||wy-x||2)).

对于给定的标定数据集

(x1,c1),….,(xM,cM)

和未标定的数据集

xM+1,…,xN,

我们分别假设它们的期望的类别分布为:

1)对于标定数据,期望类别分布Q(xiÎci)=a;当c¹ci,Q(xiÎc)=(1-a)/(C-1),显然a>1/C;

2)对于未标定数据,期望的类别分布为Q(xiÎc)=1/C,c=1,2,…C。

那么,我们优化的目标就是关于权值wy和acy对每个数据x的网络输出类别概率和期望类别分布概率的KL差最小化,即

MinåiåcQ(xiÎc)log[Q(xiÎc)/P(xiÎc)]

试推导上述推广的LVQ的学习算法,并实现推导的算法。

MNIST(http://yann.lecun.com/exdb/mnist/)数据集中选择几类手写体数字进行模式分类的问题。讨论超参数g和a的取值对分类能力影响。

上面部分符号丢失,正确文档如下:

http://docs.google.com/View?id=dg6v52pq_509g5jbx2fv

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值