Pandas数据处理

最新推荐文章于 2025-12-02 21:35:49 发布

原创最新推荐文章于 2025-12-02 21:35:49 发布 · 1.3k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#pandas #学习 #python

import pandas as pd
import numpy as np

======================
Series 对象操作
======================

创建Series
s = pd.Series(np.random.randint(1, 120, 5),
index=["er", "su", "do", "nk", "fd"],
name="随机数据")
print("原始Series:\n", s)

核心操作
print("\n索引:", s.index.tolist())
print("\n值:", s.values)
print("\n数据类型:", s.dtype)
print("\n形状:", s.shape)
print("\n前2行:\n", s.head(2))
print("\n统计描述:\n", s.describe())

数据处理
print("\n唯一值:", s.unique())
print("\n值计数:\n", s.value_counts())
print("\n平方变换:\n", s.apply(lambda x: x**2))
print("\n大于50的值:\n", s[s > 50])
print("\n排序(值):\n", s.sort_values())
print("\n排序(索引):\n", s.sort_index())

======================
DataFrame 对象操作
======================

创建DataFrame
df = pd.DataFrame(np.random.randint(1, 1000, (5, 5)),
index=["A", "B", "C", "D", "E"],
columns=["Col1", "Col2", "Col3", "Col4", "Col5"])
print("\n原始DataFrame:\n", df)

核心操作
print("\n列名:", df.columns.tolist())
print("\n索引:", df.index.tolist())
print("\n数据类型:\n", df.dtypes)
print("\n形状:", df.shape)
print("\n统计描述:\n", df.describe())
print("\n前3行:\n", df.head(3))

数据操作
print("\nCol1排序:\n", df.sort_values("Col1"))
print("\n索引排序:\n", df.sort_index(ascending=False))
print("\n选择Col1>500的行:\n", df[df["Col1"] > 500])
print("\n选择Col1和Col3:\n", df[["Col1", "Col3"]])

高级操作
print("\n行均值:\n", df.mean(axis=1))
print("\n列总和:\n", df.sum())
print("\n相关系数矩阵:\n", df.corr())