数据处理:透视表与向量化字符串操作
1. 透视表基础
1.1 透视表简介
透视表是一种常见于电子表格和其他处理表格数据程序中的操作,它以简单的列数据为输入,将条目分组到二维表中,对数据进行多维汇总。可以将其视为 GroupBy 聚合的多维版本,即进行拆分 - 应用 - 合并操作,但拆分和合并是在二维网格上进行,而非一维索引。
1.2 泰坦尼克号数据集示例
为了说明透视表的使用,我们使用 Seaborn 库中的泰坦尼克号乘客数据库:
import numpy as np
import pandas as pd
import seaborn as sns
titanic = sns.load_dataset('titanic')
titanic.head()
输出结果如下:
|survived|pclass|sex|age|sibsp|parch|fare|embarked|class|who|adult_male|deck|embark_town|alive|alone|
|----|----|----|----|----|----|----|----|----|----|----|----|----|----|----|
|0|0|3|male|22.0|1|0|7.2500|S|Third|man|True|NaN|Southampton|no|False|
|1|1|1|female|38.0|1|0|71.2833|C|First|woman|False|C|Cherbourg|yes|F
超级会员免费看
订阅专栏 解锁全文
1458

被折叠的 条评论
为什么被折叠?



