
pandas
风灵无畏YY
本蒟蒻为在校大学生,不定期更新一些有关计算机相关知识的学习记录,有不恰当的地方还请指出。
展开
-
datawhale——pandas组队学习——综合练习
说实话,我真的一题都不会做,一切都感觉那么的似曾相识,但就是不会做,不是这里有问题就是那里有问题,我放弃了。没有Python基础的我,只能等待大佬们的答案吧。 本来以为可以做完这个第一大题的,但是现在看来,我以及尽力了,尝试了好久都没弄出来,先写个记录吧,我真的太菜了。qwq 题目 第一题尝试的解答 并没有做出来什么实质性的东西。 ...原创 2020-07-01 16:52:47 · 215 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——时序数据
学习资源链接时序数据 一、总览 时序相关 二、疑问 1. 2. 3. 三、思考题 【问题一】 如何对date_range进行批量加帧操作或对某一时间段加大时间戳密度? 【问题二】 如何批量增加TimeStamp的精度? 【问题三】 对于超出处理时间的时间点,是否真的完全没有处理方法? 【问题四】 给定一组非连续的日期,怎么快速找出位于其最大日期和最小日期之间,且没有出现在该组日期中的日期? 四、练习题 【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题: (a)销售额出现最大值的是星原创 2020-06-29 19:32:36 · 208 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——分类数据
学习资源链接分类数据 一、总览 二、疑问 1.不懂下面的这个是怎么创建出来的,创建出来之后是用来干什么的。 2.在这里为什么更改类型之后里面的元素值是改变了的,并且为什么只改变了这里面abca中的aba,没有改变那个c。 解答:因为他在这里更改了类型,但是c的类型还是没有变,所以前面的那个c就不会变成nan,其他的就会变成nan,因为原先的类型变了。 3.这里前面的abca是指元素值,后面的那个abcd是指元素类型吗?并且后面的那个abcd可不可以写成efgh之类的,只是一个类型的名称而已? 对于上面的解原创 2020-06-27 16:46:59 · 320 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——文本数据
学习资源链接:pandas文本数据 一、总览 二、正则表达式 三、思考题 【问题一】 str对象方法和df/Series对象方法有什么区别? 【问题二】 给出一列string类型,如何判断单元格是否是数值型数据? 【问题三】 rsplit方法的作用是什么?它在什么场合下适用? 【问题四】 在本章的第二到第四节分别介绍了字符串类型的5类操作,请思考它们各自应用于什么场景? 四、练习题 【练习一】 现有一份关于字符串的数据集,请解决以下问题: (a)现对字符串编码存储人员信息(在编号后添加ID列),使用如下格原创 2020-06-26 20:44:41 · 278 阅读 · 0 评论 -
datawhale组队学习——pandas基础下——缺失数据
学习资源链接:pandas缺失数据 一、总览 二、疑问 1.NaT是对时序版本的缺失值 2. 3. 三、思考题 【问题一】 如何删除缺失值占比超过25%的列? 这个倒是不知道 【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计? 这是Pandas在1.0新版本中引入的重大改变,其目的就是为了(在若干版本后)解决之前出现的混乱局面,统一缺失值处理方法 【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解? 四、练习题 【练习一】现有一份虚拟数据集,列类型分别为strin原创 2020-06-22 10:14:57 · 337 阅读 · 0 评论