
pandas
数分虐我千百遍
这个作者很懒,什么都没留下…
展开
-
Pandas基础: 时序数据
文章目录Task04: 时序数据二、理解点三、 问题与作业最近考试周有点没处理好时间,考完试填补叭.1. 问题【问题一】 如何对date_range进行批量加帧操作或对某一时间段加大时间戳密度?【问题二】 如何批量增加TimeStamp的精度?【问题三】 对于超出处理时间的时间点,是否真的完全没有处理方法?【问题四】 给定一组非连续的日期,怎么快速找出位于其最大日期和最小日期之间,且没有出现在该组日期中的日期?【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:(a)销售额出现最大值的是原创 2020-06-29 21:35:30 · 1016 阅读 · 0 评论 -
Pandas基础学习:分类数据
文章目录一、 Task03: 分类数据二、 理解点三、 问题与作业1. 问题【问题一】 如何使用union_categoricals方法?它的作用是什么?【问题二】 利用concat方法将两个序列纵向拼接,它的结果一定是分类变量吗?什么情况下不是?【问题三】 当使用groupby方法或者value_counts方法时,分类变量的统计结果和普通变量有什么区别?【问题四】 下面的代码说明了Series创建分类变量的什么“缺陷”?如何避免?(提示:使用Series中的copy参数)【练习一】 现继续使用第四章中的原创 2020-06-27 21:29:12 · 2295 阅读 · 0 评论 -
Pandas基础学习: 处理文本数据
文章目录一、Task02: 文本数据二、理解点三、问题与作业1. 问题【问题一】 str对象方法和df/Series对象方法有什么区别?【问题二】 给出一列string类型,如何判断单元格是否是数值型数据?【问题三】 rsplit方法的作用是什么?它在什么场合下适用?【问题四】 在本章的第二到第四节分别介绍了字符串类型的5类操作,请思考它们各自应用于什么场景?2. 练习【练习一】 现有一份关于字符串的数据集,请解决以下问题:(a)现对字符串编码存储人员信息(在编号后添加ID列),使用如下格式:“×××(名字原创 2020-06-26 22:51:55 · 2262 阅读 · 0 评论 -
Pandas基础学习:处理缺失数据
文章目录一、Task01:缺失数据二、理解点三、问题与练习1. 问题【问题一】 如何删除缺失值占比超过25%的列?【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?2. 练习【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:(a)请以列类型读入数据,并选出C为缺失值的行。(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。【练原创 2020-06-22 21:21:00 · 1564 阅读 · 0 评论 -
第5章 合并
第5章 合并本次跟随Datawhale组队学习Pandas基础,希望能有所收获。Datawhale是一个很好的开源组织,会组织很多免费的知识学习。教程:地址一、思维导图二、问题与练习1. 问题【问题一】 请思考什么是append/assign/combine/update/concat/merge/join各自最适合使用的场景,并举出相应的例子。append: 通过dict Se...原创 2020-04-30 20:22:02 · 564 阅读 · 0 评论 -
第4章 变形
第4章 变形文章目录第4章 变形一、内容大概二、透视表1. pivot一般状态下,数据在DataFrame会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols:然而pivot函数具有很强的局限性,除了功能上较少之外,还不允许index中出现重复的行列索引对(pair),例如下面的语句就会报错:因此,更多的时候会选择使用强大的p...原创 2020-04-28 20:40:02 · 910 阅读 · 0 评论 -
第3章 分组
第3章 分组import pandas as pdimport numpy as npdf = pd.DataFrame(np.array([[1, 1], [2, 10], [3, 100], [4, 100]]), columns=['a', 'b'])dfdf.quantile(.1)a 1.3b 3.7Name: 0.1, ...原创 2020-04-26 20:53:39 · 276 阅读 · 0 评论 -
第2章 索引
第2章 索引文章目录第2章 索引大致内容一、单级索引1. loc方法、iloc方法、[]操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点(a)loc方法(注意:所有在loc中使用的切片全部包含右端点!)① 单行索引:② 多行索引:③ 单列索引:④ 多列索引:⑤ 联合索引:⑥ 函数式索引:⑦ 布尔索引(将重点在第2节介绍)小节:本...原创 2020-04-22 23:02:35 · 803 阅读 · 0 评论