18、机器学习分类方法与维度挑战解析

机器学习分类方法与维度挑战解析

1. 概率决策与多类别分类

在实际应用中,我们常常需要将概率转化为决策。例如,判断一个鸡蛋是否受精。虽然有时某个类别概率为 1,其他为 0,但更多时候区域模糊或重叠,多个类别都有非零概率。最终决策不仅受计算机预测影响,还需考虑人为因素和决策的实际意义。

以鸡蛋分类为例,最初我们只区分受精和未受精鸡蛋。但随着了解深入,发现未受精鸡蛋有两种情况:从未受精的“yolker”可食用,而受精后胚胎停止发育死亡的“quitter”不能售卖,因其可能爆裂传播有害细菌。这样就有了三类鸡蛋:“winners”(可存活的受精鸡蛋)、“yolkers”(安全的未受精鸡蛋)和“quitters”(不安全的受精鸡蛋)。

将新输入分配到这三个类别之一的任务就是多类别分类。当有多个类别时,我们要找到不同类别区域之间的边界。训练好的多类别分类器收到新样本后,会判断样本所属区域并分配相应类别。

在这个例子中,我们还可以为每个样本添加更多特征,如鸡蛋颜色、平均周长和产蛋时间等,这样每个鸡蛋就有了五个维度的数据。虽然难以直观想象五维空间,但可以类比二维空间的情况。在二维空间中,数据点会聚集在一起,我们可以绘制边界线或曲线;在高维空间中,同样可以将空间划分为多个小的高维区域,每个区域定义一个不同的类别。不过,随着维度增加,算法的运行时间和内存消耗通常也会增加。

2. 多类别分类方法
2.1 一对其余(One - Versus - Rest,OvR)

该方法也被称为一对所有(One - Versus - All,OvA)、一抗所有(One - Against - All,OAA)或二元相关性方法。假设数

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值