42、分类与聚类技术详解

分类与聚类技术详解

1. 神经网络训练问题

在进行神经网络训练时,如果训练时间过长,反向传播算法的大量自由度可能会导致系统过度适应训练数据,出现过拟合现象。为了避免这种情况,我们需要选择合适的学习停止标准,这通常基于测试数据的分类误差来确定。

为了找到合适数量的节点和层以实现良好的泛化能力,我们可以采用以下操作步骤:
1. 从一个初始网络开始,通过移除节点的方式反复修改网络结构。
2. 当移除权重非常小的边时,能够进一步改善最优泛化网络的收敛性,因为这些边大多会给分类结果带来噪声。

2. 支持向量机

2.1 线性支持向量机

支持向量机(SVM)能够在多个可能的边界中选择一个与样本距离最大的边界,这有助于减少误分类的可能性,尤其适用于训练数据仅为真实分布样本的情况。

线性支持向量机主要用于解决两类分类问题。对于线性决策边界的分类问题,分类器可以表示为:
[D(f,w,w_0) \cdot d > 0, \quad d = class(f) \in {-1,1}]
进一步可改写为:
[d \cdot (w^Tf + w_0) \geq 1]
样本 (f) 到超平面的距离 (r) 为:
[r = \frac{w^Tf + w_0}{|w|}]
所有样本 (f_i) 的最小距离 (\mu_L) 为:
[\mu_L = \min_i \left{\frac{|w^Tf_i + w_0|}{|w|}\right}]
训练任务就是找到一个能使 (\mu_L) 最大化的超平面。对于这样的超平面,某些样本 (f_b) 到超平面

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值