监督学习:回归详解
1. 监督学习概述
监督学习是机器学习算法的一种变体,用于学习输入 - 输出配对样本。数据科学家利用各种机器学习算法来获取有用的见解并发现数据中的模式,这些算法通常根据学习数据以预测未来的方法分为监督学习和无监督学习两类。
监督学习中,用户指导算法以期望的方式学习大数据,其目标是通过确定近似映射函数 (Y = f(X)) 来学习独立输入变量 (X) 和依赖输出变量 (Y) 之间的关系,目的是学习一个最优的映射函数,以便对新的未知输入数据进行外推。
常见的监督学习技术包括支持向量机(SVMs)、线性回归、逻辑回归、多类分类和决策树等。训练监督学习算法时,每个输入都需要一个正确的输出标签。监督学习可解决的问题主要分为回归和分类两类,二者的区别在于回归的输出变量是连续或数值型的,而分类的输出变量是离散或分类型的。
1.1 监督学习的现实场景
监督学习在现实生活中有广泛的应用,例如:
- 目标检测
- 语言处理
- 语音识别
- 异常检测
- 产品推荐
- 信用风险分析
- 光学字符识别
- 医学诊断
- 蛋白质结构预测
- 生物识别
1.2 监督学习的类型
监督学习技术使用标记数据来训练模型,训练过程应持续到性能水平足够高为止。训练后,系统应能正确预测新的未见数据。监督学习技术主要分为回归和分类两种:
- 分类 :将给定的输入数据分类到不同的类别中,输出是离散或分类值,如正或负、垃圾邮件或非垃圾邮件等。分类可分为二元分类和多类分类,逻
超级会员免费看
订阅专栏 解锁全文
342

被折叠的 条评论
为什么被折叠?



