机器学习基础：监督学习 vs 无监督学习

一碗黄焖鸡三碗米饭

于 2025-03-19 11:21:50 发布

阅读量1.1k

点赞数 11

分类专栏：人工智能前沿与实践文章标签：机器学习学习人工智能

本文链接：https://blog.youkuaiyun.com/sjdgehi/article/details/146364334

版权

3. 监督学习 vs 无监督学习：对比分析

4. 总结

机器学习（Machine Learning）是现代人工智能（AI）的核心技术之一，涵盖了大量的算法和方法。根据任务的不同，机器学习可以大致分为两类：监督学习和无监督学习。这两者在应用场景、数据处理、模型训练方式等方面有着显著的差异，理解这两者的区别是深入学习机器学习的基础。

在本篇文章中，我们将围绕监督学习和无监督学习的基本概念、主要区别及常见算法进行详细讲解，并通过代码示例帮助大家更好地理解两者的实际应用。

1. 什么是监督学习？

1.1 监督学习的定义

监督学习（Supervised Learning） 是指通过已标记的数据训练模型，其中“标记”是指每个输入数据都有一个已知的输出标签。在训练过程中，模型根据输入数据与真实标签之间的关系进行学习，以便对新数据进行预测。

监督学习的主要目标是从输入数据中学习映射关系（输入到输出的关系），以便在面对新的、未见过的数据时做出准确的预测。

1.2 监督学习的分类

监督学习的任务通常分为两大类：

回归问题（Regression）：输出是连续的数值。例如，预测房价、股市价格等。
分类问题（Classification）：输出是离散的类别标签。例如，垃圾邮件分类、图像识别中的猫狗分类等。

1.3 监督学习的工作流程

准备数据：收集已标注的数据集。
选择模型：根据问题选择合适的模型，例如线性回归、决策树、支持向量机（SVM）等。
训练模型：用训练数据集训练模型。
评估模型：使用测试数据集评估模型的性能，常见的评估指标有准确率、均方误差等。
预测新数据：利用训练好的模型对新数据进行预测。

1.4 监督学习示例代码（分类问题）

# 导入必要的库
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 加载数据集
data = load_iris()
X = data.data  # 特征
y = data.target  # 标签

# 划分训练集和