一.规整数据
1.轴向连接
默认情况下是沿0轴连接,当然也可以指定
当两个数组元素个数不同时,会用 NaN 代替
指定轴连接方向为1轴
设定多级索引
可能出出现这种情况
例如,设定的索引名相同,但不对应,连接时会如何呢?
结果是按照对应索引名称连接
2.合并数据
pd.merge()函数
一个有意思的函数
作用:按照索引方向取交集
按照维度方向取并集
注意这两个的差别
3.组合数据之数据补充
复习一下 np.where 函数
第一个参数是判段条件,满足执行第二个参数,否则执行第三个
数据补充例子
用 b 来补充 a
即若没有则补充,若有,则不管
4.数据转换
(1)行列转换
这里只有一个 ‘dropna’ 参数需要注意
因为默认情况下,NaN是会被丢掉的;
如果不想扔,则通过参数设定
(2)透视表
完成对重复数据的合并
二.分组运算
xxxx.describe() 可以显示出有多少条数据
1.合并
借用上面的 students
通过 groupby 方法合并,并且是可迭代的
也可以通过关键字筛选内容
添加内容修饰
2.分组的键
展示 groupby 的全部用法
以科目为标准,求平均值
当参数是函数时,实现横向和纵向合并
最后以 ‘subject’为标准,显示各项数据