
Pandas学习专栏
zyuPp
你今日练习了吗?
展开
-
【Pandas】【合并】
Pandas合并合并1.append与assign1.1 append1.2 assign2. combine和update2.1 combine2.2 update3. concat4.merge和join4.1 merge4.2 join总结合并1.append与assign1.1 append(1)添加Series行genderheight0M1731F1632M155注:一定要指定name属性s = pd.Series(['gender原创 2020-07-30 10:48:53 · 189 阅读 · 0 评论 -
【Pandas】【缺失数据处理】
缺失数据处理1.基础概念1.1两种类型的缺失值可忽略的缺失值不可忽略的缺失值1.2缺失值的处理方法删除存在缺失值的个案插补缺失值(以最可能的值)2.观测缺失值与其类型2.1 如何探索数据中的缺失值2.2 三种缺失符号2.2.1 np.nan3.缺失值的运算和分组4.填充与剔除5.插值1.基础概念1.1两种类型的缺失值可忽略的缺失值完全随机缺失:缺失数据发生的概率与已观察数据和未观察数据无关随机缺失:缺失数据发生的概率与所观察到的变量有关,与未观察到的数据无关不可忽略的缺失值不完全变量中数据的缺原创 2020-07-30 10:49:02 · 906 阅读 · 0 评论 -
【Pandas】【变形】
学习内容与资源来自于Datawhale成员分享,感谢耿同学Pandas变形1. 透视表1.1 pivot1.2 pivot_table1.2.x 常用参数1.3 crosstab交叉表2. 其他变形方法2.1. melt函数2.2. 压缩与展开3. 哑变量与因子化3.1. Dummy Variable(哑变量)3.2. factorize方法常见问题1. 透视表1.1 pivotDataFrame会将数据以压缩状态存放,如性别的M和F,pivot函数的作用就是可以将某一列作为新的列来展示.co.原创 2020-07-17 17:38:44 · 270 阅读 · 0 评论 -
【Pandas】【分组操作】
分组简介分组操作流程有三:**split , apply , combine**常见apply过程的问题groupby函数1.按照某一列来分组获得某个school的信息:2.按照多列来分组3.其他调用方法4. 可通过一下代码查看groupby对象可用的函数5. groupby对象的head和first6. 分组的依据规则根据奇偶行分组若使用的是多层索引,则lambda表达式中输入为元组groupby中的[]操作对连续性变量使用cut函数做分组聚合(Aggregation)常用聚合函数同时使用单个或多个聚合函原创 2020-07-14 14:40:07 · 3406 阅读 · 0 评论 -
【Pandas】【索引操作】
关于索引的一些常用操作单级索引lociloc[] 操作符Series 的[]操作Dataframe的[]操作布尔索引快速标量索引at 和 iat方法,快速获取一个元素区间索引划分区间的interval_range方法用cut将数值列转为区间的分类元素区间索引的选取多级索引前言:此文知识点是由Datawhale提供的pandas学习材料中总结而来,感谢闫大佬的分享。Pandas学习项目github链接单级索引在数据处理中,我们比较常用的索引方法有三种:loc 标签索引iloc 位置索引[] 一种原创 2020-06-03 15:09:41 · 590 阅读 · 0 评论