
pandas
Sweeney Chen
厚积薄发!
展开
-
pandas数据结构
Python数据分析:pandas数据结构Series:类似一维数组的对象通过list构建Seriesser_obj = pd.Series(range(10))import pandas as pd# 通过list构建Seriesser_obj = pd.Series(range(10, 20))print(type(ser_obj))运行结果:由数...原创 2019-04-27 10:17:41 · 180 阅读 · 0 评论 -
pandas练习(一)
pandas练习(一)建立一个以 2018 年每一天为索引,值为随机数的 Seriesdti = pd.date_range(start='2018-01-01',end='2018-12-31',freq='D')s = pd.Series(np.random.rand(len(dti)),index=dti)s统计s 中每一个周三对应值的和s[s.index.weekday ==...原创 2019-05-12 17:21:41 · 1911 阅读 · 0 评论 -
pandas数据重构与数据转换
Python数据分析:pandas数据重构与数据转换重构import numpy as npimport pandas as pddf_obj = pd.DataFrame(np.random.randint(0,10, (5,2)), columns=['data1', 'data2'])df_obj运行结果:stack将列索引旋转为行索引,完成层级索引stack...原创 2019-04-28 21:59:02 · 1187 阅读 · 0 评论 -
pandas数据合并
Python数据分析:pandas数据合并pd.concat沿指定轴方向将多个对象合并到一起注意指定轴的方向,默认axis=0# index 没有重复的情况ser_obj1 = pd.Series(np.random.randint(0, 10, 5), index=range(0,5))ser_obj2 = pd.Series(np.random.randint(0, 10,...原创 2019-04-28 16:03:59 · 441 阅读 · 0 评论 -
pandas数据连接
python数据分析:pandas数据连接pd.mergeimport pandas as pdimport numpy as npdf_obj1 = pd.DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1' : np.random.randint(0,10,7)})...原创 2019-04-28 14:36:22 · 350 阅读 · 0 评论 -
pandas分组与聚合
Python数据分析:pandas分组与聚合分组(groupby):对数据集进行分组,然后对每组进行统计分析SQL能够对数据进行过滤,分组聚合pandas能利用groupby进行更加复杂的分组运算分组运算过程split(拆分):进行分组的根据apply(应用):每个分组运行的计算规则combine(合并):把每个分组的计算结果合并起来impo...原创 2019-04-28 11:49:30 · 3244 阅读 · 0 评论 -
pandas层级索引
Python数据分析:pandas层级索引import pandas as pdimport numpy as npser_obj = pd.Series(np.random.randn(12), index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c', 'd', 'd', 'd'], ...原创 2019-04-28 10:32:37 · 614 阅读 · 0 评论 -
pandas统计计算和描述
Python数据分析:pandas统计计算和描述常用统计计算:sum, mean, max, minaxis=0表示按列统计,axis=1按行统计skipna 排除缺失值,默认为Trueidmax, idmin, cumsumimport numpy as npimport pandas as pddf_obj = pd.DataFrame(np.rand...原创 2019-04-27 22:15:10 · 1060 阅读 · 0 评论 -
pandas数据操作
Python数据分析:pandas数据操作索引操作:series索引ser_obj[‘label’] 通过索引名称访问ser_obj[pos] 索引位置访问import pandas as pdser_obj = pd.Series(range(5), index = ['a', 'b', 'c', 'd', 'e'])print(ser_obj.head())pr...原创 2019-04-27 14:31:11 · 288 阅读 · 0 评论 -
pandas练习(二)
pandas练习(二)透视表的创建df = pd.DataFrame({'A': ['one', 'one', 'two', 'three'] * 3, 'B': ['A', 'B', 'C'] * 4, 'C': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'] * 2, ...原创 2019-05-13 18:05:24 · 494 阅读 · 0 评论