在机器学习领域,分类和回归是两种最常见的预测建模任务,二者在应用上有着显著的区别。分类任务旨在预测离散标签,而回归任务则是预测连续的数值。
本文将详细阐述分类与回归问题的定义、评价指标及其在预测任务中的应用区别,帮助理解如何正确应用和评估分类与回归模型。
函数逼近问题
预测建模 是一种使用历史数据建立模型的过程,旨在对未知数据进行预测。预测建模可以描述为逼近一个从输入变量(X)到输出变量(y)的映射函数(f),其目标是在有限的时间和资源内,找到最优的映射函数,以最大限度地准确预测输出。
在机器学习任务中,这一函数逼近问题可以分为两类:分类任务和回归任务。分类是将输入映射到离散类别,而回归是将输入映射到连续的数值。
分类预测建模
分类预测建模的任务是将输入变量(X)映射到离散的输出类别(y)。在分类任务中,输出变量通常被称为标签或类别。例如,垃圾邮件过滤是一个典型的分类任务,其目标是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。
分类问题的特点
在机器学习分类任务中