- 博客(5)
- 收藏
- 关注
原创 综合练习
仅作学习打卡使用。 一、端午节的淘宝粽子交易 问题 (1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。 (2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录? (3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。 (4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。 (5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计
2020-07-01 21:44:33
173
原创 时序数据
时序的创建 一、 四类时间变量 二、 时间点的创建 1.to_datetime方法 对于DataFrame而言,如果列已经按照时间顺序排好,则利用to_datetime可自动转换 2.时间精度与范围限制 Timestamp的精度可以最小到纳秒ns,它带来范围的代价就是只有大约584年的时间点是可用的 3.date_range方法 一般来说,start/end/periods(时间点个数)/freq(间隔方法)是该方法最重要的参数,给定了其中的3个,剩下的一个就会被确定 其中freq参数有许多选项
2020-06-29 21:30:12
496
原创 分类数据
(一)、category的创建及其性质 一、 分类变量的创建 1.用Series创建 2.对DataFrame指定类型创建 3.利用内置Categorical类型创建 4.利用cut函数创建 默认使用区间类型为标签 可指定字符为标签 二、分类变量的结构 一个分类变量包括三个部分,元素值(values)、分类类别(categories)、是否有序(order) 从上面可以看出,使用cut函数创建的分类变量默认为有序分类变量 下面介绍如何获取或修改这些属性 1.describe方法 该方法描述了一个分
2020-06-27 21:35:55
2214
原创 文本数据
文本数据 一、string类型的性质 (一)、 string与object的区别 string类型和object不同之处有三: 1.字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型 2. 某些Series方法不能在string上使用,例如: Series.str.decode(),因为存储的是字符串而不是字节 3. string类型在缺失值存储或运算时,类型会广播为pd.NA,而不是浮点型n
2020-06-26 21:22:08
998
原创 Pandas 学习
Task01-缺失数据 缺失值观测及其类型 一、了解缺失信息 (1) isna和notna方法 isna确定哪些是缺失值而notna确定哪些是非缺失值 df.isna().sum() 查看有多少缺失值 等同于 pd.isnull(df).sum() 通过df.info()查看缺失信息 (2) 查看所有存在缺失值的行 df[df['colname'].isna()]--查看某一列中所有存在缺失值的行 (3) 挑选出所有非缺失值列 df[df.notna().all(1)]--...
2020-06-23 22:53:01
294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人