机器学习问题类型与回归模型构建详解
1. 机器学习问题类型概述
在机器学习中,我们会根据输入特征和标签的性质使用不同的模型和技术。下面详细介绍几种常见的机器学习问题类型。
1.1 回归(Regression)
当标签是一个数值时,这类机器学习问题被称为回归。例如,预测某场电影的售票数量,这里的售票数量就是一个数值标签,对应的问题就是回归问题。
1.2 分类(Classification)
若标签是一个分类变量,那么该问题属于分类问题。分类模型的输出是某一行数据属于某个标签值的概率。
- 二元分类(Binary Classification) :许多分类问题只有两个类别,如演出是否售罄、顾客是否购买商品、航班是否晚点等。在这种情况下,标签列通常为 True 或 False,或者 1 或 0。模型的预测结果是标签为 True 的概率,一般以 0.5 为阈值来确定最可能的类别。
- 多分类(Multiclass Classification) :分类问题也可以有多个类别。例如,在自行车租赁场景中,预测自行车归还的站点,由于这个分类标签有数百个可能的值,这就是一个多分类问题。机器学习模型的输出是一组概率,每个站点对应一个概率,且这些概率的总和为 1.0。在多分类问题中,我们通常关注前三个或前五个预测结果,而不是概率的实际值。
1.3 推荐系统(Recommender)
基于评分或过去的购买行为来推荐“下一个”产品的多分类特殊情况,被称为推荐系统。虽然推荐问题可以用解决所有多分类问题的标准方法来解决,但针
超级会员免费看
订阅专栏 解锁全文
3402

被折叠的 条评论
为什么被折叠?



