
Pandas
Roddy_Liu
这个作者很懒,什么都没留下…
展开
-
Pandas数据重塑和透视
使用多层索引进行重塑 stack(堆叠) :旋转或将列中的数据透视到行 unstack(拆堆):将行中的数据透视到列 data.stack() data.unstack() data.unstack(0) #0表示最外层 data.unstack('key1').stack('key2') 数据透视 长透视为宽: data.piovot() dat...原创 2019-08-07 22:27:11 · 736 阅读 · 0 评论 -
Pandas时间序列进阶(日期范围,频率,移位,时区处理)
日期范围 生成日期范围:pd.date_range()方法用于根据特定频率生成指定长度的DatetimeIndex pd.date_range( start=None, end=None, periods=None, freq=None, tz=None, normalize=False, #时间标准化为0 ...原创 2019-08-09 18:48:51 · 1362 阅读 · 0 评论 -
Pandas分层索引
pandas允许你在一个轴向上有多个索引层级,提供了一种在更低纬度的形式中处理更高维度数据的方式 分层索引的创建 已有的dataframe数据: data.set_index(['key1','key2']) data = pd.Series(np.random.randn(9),index=[[ ],[ ]]) 分层索引的命名 data.index.names = ['key1','...原创 2019-08-07 16:58:16 · 443 阅读 · 0 评论 -
Pandas数据清洗与准备
处理缺失值 NA处理方法 dropna 根据每个标签的值是否是缺失值来筛选轴标签,并根据允许缺失的数据量来确定阈值(应用于行) fillna 用某些值来填充确实的数据或使用插值方法,(ffillna或bfillna)(应用于列) isnull 返回表明哪些值是缺失值的布尔值 notnull ...原创 2019-08-07 16:19:30 · 683 阅读 · 0 评论 -
Pandas时间序列基础(转换,索引,切片)
时间序列的类型: 时间戳:具体的时刻 固定的时间区间:例如2007年的1月或整个2010年 时间间隔:由开始时间和结束时间表示,时间区间可以被认为是间隔的特殊情况 实验时间和消耗时间:每个时间是相对于特定开始时间的时间的量度,(例如自从被放置在烤箱中每秒烘烤的饼干的直径) 日期和时间数据的类型及工具 datetime模块中的类型: date 使用公历日历存储日历日...原创 2019-08-09 16:22:59 · 7653 阅读 · 0 评论 -
pandas入门
首先介绍一下numpy 和 pandas的区别: numpy pandas 基础数据类型 扩展数据类型 关注的是数据结构表达 关注的是数据应用表达 维度:数据间的关系 ...原创 2019-08-06 22:58:29 · 269 阅读 · 0 评论 -
Pandas数据透视表和交叉表
数据透视表pivot_table和数据透视pivot的区别 数据透视和数据透视表的区别 简单的讲就是如果数据中的一个值对应的行索引和列索引都相同时,pivot将会报错:Index contains duplicate entries, cannot reshape,pivot_table不会报错,默认计算相同数据的均值并返回。 如果每个值对应的行索引和列索引都是唯一的,两者的结果也是一样的。 dt...原创 2019-08-08 23:43:26 · 982 阅读 · 0 评论 -
Pandas分组应用实例
分组技术与分箱技术连用 data = pd.DataFrame({'data1':np.random.randn(1000), 'data2':np.random.randn(1000)}) quantiles = pd.cut(data.data1,4) #得到categories对象 grouped = data.data1....原创 2019-08-08 21:23:44 · 441 阅读 · 0 评论 -
Pandas 数据聚合与分组操作
GroupBy机制 分组聚合图示 grouped操作 data city US JP tenor 1 3 5 1 3 0 -0.423185 0.107952 0.051819 -3.058473 -0.648571 1 0.011324 -1.096422 -0.60593...原创 2019-08-08 14:52:06 · 1193 阅读 · 0 评论 -
Pandas联合和合并数据集
连接方式 pandas.merge 根据一个或多个键将行进行连接,与SQL数据库的1连接操作类似 pandas.concat 使对象在轴向上进行黏合或 ‘堆叠’ join() combine_first()实例方法允许将重叠的数据拼接在一起,以使用一个对象的值填充另个对象的缺失值 pd.merge() 多对一连接:df1在连接键所对应列中的值每个值有多个,df2在连接键所对应列中的值每个...原创 2019-08-07 20:45:16 · 940 阅读 · 0 评论