机器学习的核心要素:任务、特征与模型
1. 机器学习概述
机器学习的核心在于利用合适的特征构建合适的模型,以完成特定的任务。特征是描述领域中相关对象的“语言”,一旦有了合适的特征表示,通常就无需再回到领域对象本身,因此特征在机器学习中起着至关重要的作用。任务是我们想要解决的关于领域对象的问题的抽象表示,常见形式是将对象分类到两个或多个类别中,但在实际应用中还会遇到其他类型的任务。而模型则是机器学习算法应用于训练数据后产生的映射。
2. 机器学习可解决的任务
2.1 分类任务
- 二分类 :以垃圾邮件识别为例,这是一个典型的二分类任务,也是机器学习中最常见的任务之一。
- 多分类 :除了二分类,还存在将对象分类到多个类别的情况。例如,区分不同类型的正常邮件,如工作邮件和私人邮件。可以将其看作两个二分类任务的组合,但这样可能会丢失一些有用信息,因为有些垃圾邮件可能更像私人邮件而非工作邮件。因此,将多分类视为一个独立的机器学习任务往往更有益,不过在这种更一般的情况下,一些概念需要重新思考,例如决策边界的概念在多分类中就不那么明显。
2.2 回归任务
有时,放弃离散类别的概念,预测一个实数会更自然。例如,评估一封传入邮件的紧急程度,这就是回归任务。回归本质上是从带有真实函数值标签的训练示例中学习一个实值函数。通常的做法是选择一类函数(如函数值线性依赖于某些数值特征的函数),并构建一个使预测值与真实值之间差异最小化的函数。需要注意的是,这与 SpamAssassin 学习实值垃圾邮件分数有所不同,Sp
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



