高性能机器学习:NumPy与鸢尾花数据集实战
1. 机器学习与预测
机器学习着重于衡量预测能力,借助 scikit-learn 库,我们能够精准且快速地进行预测。为了衡量预测的准确性,通常会采取以下步骤:
- 预留部分数据用于测试
- 仅使用训练数据构建模型
- 在测试集上评估模型的预测能力
预测鸢尾花属于三种类型中的哪一种,这是一个分类问题。简单来说,分类问题就像在问“这是苹果还是橙子”,而回归问题则是询问“有多少个苹果”,回归问题的答案可以是像 4.5 个苹果这样的实数。
scikit-learn 主要通过以下四个类别来处理机器学习问题:
- 分类
- 非文本分类,如鸢尾花分类示例
- 文本分类
- 回归
- 聚类
- 降维
2. NumPy 基础
数据科学在一定程度上涉及结构化的数据表,而 scikit-learn 库要求输入的是二维 NumPy 数组。下面我们详细介绍 NumPy 数组的相关操作。
2.1 NumPy 数组的形状和维度
以下是操作步骤:
1. 导入 NumPy 库:
import numpy as np
- 创建一个包含 10 个数字的
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



