Pandas 数据处理全解析
1. 数据框基础操作与聚合运算
首先,我们来看一个简单的数据框示例:
import pandas as pd
data = {
'X1': [4, 8, 6],
'X2': [2, 1, 9],
'X3': [3, 5, 8],
'X4': [1, -4, -8]
}
df = pd.DataFrame(data)
print("数据框内容:")
print(df)
# 按行聚合求和与求最小值、最大值
agg_sum_min_max = df.agg(['sum', 'min', 'max'])
print("\n按行聚合求和、最小值和最大值:")
print(agg_sum_min_max)
# 按列求均值
agg_mean = df.mean()
print("\n按列求均值:")
print(agg_mean)
上述代码创建了一个简单的数据框,然后对其进行了按行聚合求和、求最小值和最大值,以及按列求均值的操作。
2. 泰坦尼克号数据集的聚合操作
接下来,我们使用泰坦尼克号数据集 titanic.csv 进行更复杂的聚合操作。
import pandas as pd
# 加载泰坦尼克号数据集
df = pd.read_csv("titanic.csv")
# 将浮点值转换为整数
df['survived'] = df['survived'].astype(int)
# 指
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



