1. 安装 Pandas
首先,确保你已经安装了 Pandas。你可以使用以下命令安装:pip install pandas
2. 导入 Pandas
在开始使用 Pandas 之前,你需要先导入它:import pandas as pd
3. 创建数据结构
Pandas 主要有两种数据结构:Series
和 DataFrame
。
3.1 Series
Series
是一个一维的标签数组,类似于 Python 的列表或字典。
import pandas as pd
s = pd.Series([1,2,3, np.nan, 6, 8, None], dtype=np.float32)
print(s)
s2 = pd.Series([100, 200, 300, 400], ["A", "B", "C", "D"]) # pd.Series(data, index) data 与 index 必须都是一维的
print(s2)
s2.to_csv("s2.csv") # 将数据保存为 csv
s3 = pd.Series(np.arange(12)) # 从 ndarray 创建
s4 = pd.Series({
"a": 1, "b": 2, "c": 3}) # 从字典创建
s5 = pd.Series(5, ["a", "b", "c"]) # 从标量值 创建
print(s5['a']) # Series 中数组的访问 类似于 python 中字典的访问
3.2 DataFrame
DataFrame
是一个二维的标签数据结构,类似于电子表格或 SQL 表格。
# 创建一个 DataFrame
data = {
"A": [1, 2, 3, 4, 5],
"B": [6, 7, 8, 9, 10],
"C": [11, 12, 13, 14, 15]
}
df = pd.DataFrame(data)
print(df)
# 使用多个 series 来构建 series 中可以缺少数据
df2 = pd.DataFrame({
'name': pd.Series(["Tom", "Nick", "John", "Tom", "John"], index = ["A", "B", "C", "D", "E"]),
'age': pd.Series([20, 21, 19, 22,], index = ["A", "B", "C", "D"]),
'gender': pd.Series(["M", "M", "M", "F", "F"], index = ["A", "B", &#