
pandas
wield_jjz
这个作者很懒,什么都没留下…
展开
-
数据分析之pandas-综合练习1
数据分析之pandas-综合练习1 一、2002 年-2018 年上海机动车拍照拍卖 import pandas as pd import numpy as np df = pd.read_csv('./data/2002年-2018年上海机动车拍照拍卖.csv') df.head() df.info() 问题 (1) 哪一次拍卖的中标率首次小于 5%? 考察点:创建列、索引 df1 =...原创 2020-05-01 23:45:12 · 462 阅读 · 0 评论 -
数据分析之pandas-第5章 合并
pandas学习 第5章 合并 一、append与assign append方法 (a)利用序列添加行(必须指定name) df_append = df.loc[:3,['Gender','Height']].copy() df_append s = pd.Series({'Gender':'F','Height':188},name='new_row') df_append.append(...原创 2020-04-30 20:41:36 · 261 阅读 · 0 评论 -
数据分析之pandas-第4章 变形
pandas学习-第4章 变形 一、透视表 二、其他变形方法 三、哑变量与因子化 四、问题与练习 问题 【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。 【问题二】 变形函数和多级索引是什么关系?哪些变形函数会使得索引维数变化?具体如何变化? 【问题三】 请举出一个除了上文提过的关于哑...原创 2020-04-28 17:30:45 · 309 阅读 · 0 评论 -
数据分析之pandas-第3章 分组
pandas学习-第3章 分组 一、SAC过程 内涵 SAC指的是分组操作中的split-apply-combine过程 split指基于某一些规则,将数据拆成若干组 apply是指对每一组独立地使用函数 combine指将每一组的结果组合成某一类数据结构 apply过程 在该过程中,我们实际往往会遇到四类问题: 整合(Aggregation)——即分组计算统计量(如求均值、求每组元...原创 2020-04-26 19:34:48 · 393 阅读 · 0 评论 -
数据分析之pandas-第2章 索引
pandas学习-第2章 索引 一、单级索引 loc方法 iloc方法 []操作符 1、loc方法(注意:所有在loc中使用的切片全部包含右端点!) df.loc[行号] df.loc[[起始行,结束行]] # 单行索引 df.loc[1103] # 多行索引 df.loc[[1102,2304]] #从1102行到2304行,包括2304行 df.loc[[1304:]] #从1102行到...原创 2020-04-23 19:02:03 · 368 阅读 · 0 评论 -
数据分析之pandas-第1章 pandas基础
pandas学习-第1章 pandas基础 文件读取与写入 import pandas as pd import numpy as np # 读取 df = pd.read_csv('data/table.csv') df_txt = pd.read_table('data/table.txt') df_excel = pd.read_excel('data/table.xlsx') pd.re...原创 2020-04-20 19:10:35 · 257 阅读 · 0 评论