
Pandas
记录Pandas学习过程
条件反射104
中国科学院大学自动化研究所
展开
-
Pandas基础:文件读取与写入、Series和Dataframe、常用基本函数、排序
import pandas as pd import numpy as np 查看Pandas版本 pd.__version__ 一、文件读取与写入 1.读取 (a)csv格式 df = pd.read_csv(r'C:\Users\chenyiqun\Desktop\joyful-pandas-master\joyful-pandas-master\data\table.csv') df.head() (b)txt格式 df_txt = pd.read_table(r'C:\Users\cheny原创 2020-07-02 08:39:28 · 5287 阅读 · 7 评论 -
Pandas 综合练习
Task05:综合练习 一、端午节的淘宝粽子交易 问题 (1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。 (2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录? (3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。 (4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。 (5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共原创 2020-07-01 22:06:28 · 413 阅读 · 0 评论 -
Pandas处理时序数据
一、时序的创建 1. 四类时间变量 2. 时间点的创建 3. DateOffset对象 二、时序的索引及属性 1. 索引切片 2. 子集索引 3. 时间点的属性 三、重采样 1. resample对象的基本操作 2. 采样聚合 3. 采样组的迭代 四、窗口函数 1. Rolling 2. Expanding ...原创 2020-06-29 21:28:59 · 369 阅读 · 0 评论 -
对于Pandas和Numpy中axis参数的理解
如何理解Pandas中axis参数的使用? ① df.drop(index, axis=0),是去掉某一行数据; df.drop(col_name, axis=1),是去掉某一列的数据。 ② df.sum(axis=0),是求每列的数据之和; df.sum(axis=1),是求每行的数据之和。 从这张图可以看出: axis=0、axis=index,指的是遍历每个index、行号,即在纵向上遍历每列,所以做sum()、mean()等运算时,是对每列数据做操作,而drop(index, axis=0),传入原创 2020-06-28 10:09:46 · 966 阅读 · 1 评论 -
Pandas处理分类数据
一、category的创建及其性质 1.分类变量的创建 (a)用Series创建 (b)对DataFrame指定类型创建 (c)利用内置Categorical类型创建 (d)利用cut函数创建 2.分类变量的结构 (a)describe方法 (b)categories和ordered属性 3. 类别的修改 (a)利用set_categories修改 (b)利用rename_categories修改 (c)利用add_categories添加 (d)利用remove_categories移除 (e)删除元素值原创 2020-06-27 20:10:58 · 586 阅读 · 0 评论 -
Pandas处理文本数据
一、string类型的性质 1.string与object的区别 2.string类型的转换 二、拆分与拼接 1.str.split方法 2.str.cat方法 三、替换 1.str.replace的常见用法 2.子组与函数替换 3.关于str.replace的注意事项 四、子串匹配与提取 1.str.extract方法 2.str.extractall方法 3.str.contains和str.match 五、常用字符串方法 1.过滤型方法 2.isnumeric方法 ...原创 2020-06-26 20:41:49 · 357 阅读 · 0 评论 -
Pandas处理缺失数据
一、缺失观测及其类型待续 1.了解缺失信息 2.三种缺失符号 3.Nullable类型与NA符号 4.NA的特性 5.convert_dtypes方法 二、缺失数据的运算与分组 1.加号与乘号规则 2.groupby方法中的缺失值 三、填充与剔除 1.fillna方法 2.dropna方法 四、插值(interpolation) 1.线性插值 2.高级插值方法 3.interpolate中的限制参数 ...原创 2020-06-23 21:50:16 · 222 阅读 · 0 评论