高性能机器学习之NumPy实战
1. 机器学习基础与NumPy简介
在机器学习领域,预测能力的衡量至关重要。我们可以借助 scikit-learn 库实现准确且快速的预测。这里将以鸢尾花数据集为例,该数据集包含了三种鸢尾花(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的测量数据。
为了衡量预测的准确性,我们通常会采取以下步骤:
1. 预留部分数据用于测试。
2. 仅使用训练数据构建模型。
3. 在测试集上评估模型的预测能力。
预测鸢尾花的类别属于分类问题,简单来说,分类问题就像是判断“这是苹果还是橙子”;而回归问题则是询问“有多少个苹果”,其答案可以是像4.5这样的实数。 scikit-learn 主要通过以下四个类别来处理机器学习问题:
- 分类:包括非文本分类(如鸢尾花分类示例)和文本分类。
- 回归。
- 聚类。
- 降维。
2. NumPy基础操作
2.1 NumPy数组的形状和维度
NumPy数组的所有元素具有相同的数据类型,并且有预定义的形状。以下是一些基本操作示例:
import numpy as np
# 生成一个包含10个数字的NumPy数组
array_1 = np.arange(10)
print(array_1) # 输出: [0 1 2 3 4 5 6 7 8 9]
# 查看数组的形状
print(array_1.shape) # 输出: (10,)
# 查看数组的维度
print(ar
超级会员免费看
订阅专栏 解锁全文
1132

被折叠的 条评论
为什么被折叠?



