机器学习:分类

分类问题是机器学习的基础,包括二元分类、多类分类和多标签分类。分类过程涉及收集训练数据、特征选择、模型训练和应用。常见的分类器有基于实例的K-最近邻(KNN)和生成模型如朴素贝叶斯。KNN算法通过计算新样本与训练样本的距离,选取最近邻进行分类。模型选择时,简单的模型往往更优。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类问题

分类问题是机器学习当中的一个基本问题,通常被分为以下三类:

  1. 二元分类问题:二元输出
  2. 多类分类问题:输出许多离散类标签之一。 类标签是互斥的
  3. 多标签分类问题:一个样本可以分配给多个标签

二分类问题便是分类任务当中有两个类别。一个典型的例子是判断是不是垃圾邮件,判断的结果只有是垃圾邮件和不是垃圾邮件两个结果;另一个典型的例子是判断一张图片是不是猫,训练一个分类器,输入一张图片,输出结果为是猫或者不是猫。

多类分类问题则表示分类任务中有多个类别。一个典型的例子是对一张水果的图片进行分类,图中的水果可能是苹果,橘子,香蕉亦或者是别的类型的水果。多类分类问题的另一个特征是一个样本有且只有一个标签,一个水果可以是苹果,也可以是香蕉,但是不可能同时是苹果和香蕉。

多标签分类则是给每个样本一系列的目标标签,可以想象成一个数据点的各个属性不是相互排斥的。一个典型的例子是文档分类,一个文档可以同时包含金融,政治,宗教相关的话题。

多类问题的第一个策略:直接分成多类。

 

多类问题的第二个策略:一对一的策略。

 

一对其余策略。

 

分类系统的构建通常遵循以下四个步骤:

  1. 收集训练数据。比如 (x,y)对,x表示输入,y则表示输出类标签
  2. 查找表示输入数据的特征
  3. (可选)训练分类器以找到最佳映射函数 f
  4. 将分类器应用于未观察到的数据(检验/应用)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值