本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
数据的累计统计分析是能够对序列中的前n个数进行累计运算,对于一些大量的数据分析中,可以减少for循环的使用,也使得数据的运算变得更加灵活。pandas提供了一组数据累计统计分析函数,这些函数都适用于Series和DataFrame类型。
| .cumsum() | 依次给出前1,2,……,n个数的和 |
|---|---|
| .cumprod() | 依次给出前1,2,……,n个数的积 |
| .cummin() | 依次给出前1,2,……,n个数的最小值 |
| .cummax() | 依次给出前1,2,……,n个数的最大值 |
b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c', 'a', 'd', 'b'])
b
0 1 2 3 4
c 0 1 2 3

本文总结了Python数据分析库pandas的累计统计分析功能,包括如何对Series和DataFrame进行累计运算,以减少for循环,提升数据分析效率。同时介绍了pandas的滚动计算(窗口计算)函数,用于计算相邻元素的统计值。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



