Python 数据科学入门:NumPy、Pandas 与 Scikit-learn 实战
1. Pandas 入门
在数据科学领域,Pandas 是一个广泛使用的 Python 库,它建立在 NumPy 之上,能够高效存储和处理带有行标签和列标签的大型数据集。以下是使用 Pandas 的详细步骤:
1.1 安装与导入
首先,使用以下命令安装 Pandas:
(venv) $ pip install pandas
安装完成后,在 Python 解释器中导入 Pandas:
(venv) $ python
>>> import pandas as pd
1.2 使用 Pandas Series 处理一维数据
Pandas 的 Series 数据结构类似于 NumPy 的一维数组。可以通过以下方式创建一个 Series:
>>> s = pd.Series([1, 2, 3, 4, 5])
>>> s
0 1
1 2
2 3
3 4
4 5
dtype: int64
实际上,Pandas 在底层创建了一个 NumPy 数组来存储数据,可以通过 values 属性验证:
Python数据科学实战:Pandas与Scikit-learn
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



