集成学习Ensemble Learning（一）| 机器学习的三大主要任务

机器学习三大任务：集成学习Ensemble Learning概览

最新推荐文章于 2025-09-30 16:08:51 发布

原创

最新推荐文章于 2025-09-30 16:08:51 发布 · 227 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

本文介绍了机器学习的三大任务：监督学习（包括回归和分类）、无监督学习和强化学习。通过scikit-learn库中的波士顿房价数据集和鸢尾花数据集举例说明，强调了回归预测价格、分类决策和无监督学习发现模式的重要性。

机器学习的三大主要任务

概述
监督学习
- 回归
- 分类
无监督学习
强化学习
总结
附：scikit-learn工具库自带的数据集

概述

这次参加集成学习的组对学习，加油加油~ 距离上次系统地学机器学习已经大半年了，好多基础知识都忘得差不多了。正好趁这次再回顾一下，也可以复习一下python里面的一些库的使用方法。
在一般情况下，用x_ik 表示特征数据，大写X表示特征x的向量矩阵。对于特征，都用x^(k) 表示，而样本用x_i 表示。
e.g. 第1个样本的第2个特征为x₁₂ ，第5个样本的第3个特征为x₅₃

监督学习

回归

监督学习中的回归，可以看做是一个线性问题。
回归的一个很典型的例子就是波士顿房价，这是sklearn库中自带的很多数据集中的一个。不得不感叹这个库是真的挺强大的。

from sklearn import datasets
boston = datasets.load_boston()     # 波士顿房价数据集，返回一个类似于字典的类
X = boston.data # 特征X的向量矩阵，数据类型为
y = boston.target # 因变量（房价）的向量
features = boston.feature_names
boston_data = pd.DataFrame(X,columns=features)
boston_data["Price"] = y
boston_data.head()

【scikit-learn官方文档给的返回参数】
data ：ndarray of shape (506, 13)
数据矩阵
target：ndarray of shape (506, )
回归的目标
filename：str
The physical location of boston csv dataset.
feature_names：ndarray
The names of features
~~ndarray是Numpy的N维数组对象

按照数据集画图如下

sns.scatterplot(boston_data['AGE'],boston_data['Price'],color="b",alpha=0.8) # 点图，一定要输入X，和y，才会有图出来，后面都是可设置的参数
plt.title("Price~AGE")
plt.show()

Price~AGE

分类

分类可以看做一个多元化问题，做的是判断，非黑即白。
依然是sklearn自带的数据集，是通过鸢尾花的 花瓣大小 和花萼大小 间的关系来判断它是哪个品种。

from sklearn import datasets
iris = datasets.load_iris(

最低0.47元/天解锁文章