描述统计学(descriptive statistics)是一门统计学领域的学科,主要研究如何取得反映客观现象的数据,并以图表形式对所搜集的数据进行处理和显示,最终对数据的规律、特征做出综合性的描述分析。Pandas 库正是对描述统计学知识完美应用的体现,可以说如果没有“描述统计学”作为理论基奠,那么 Pandas 是否存在犹未可知。下列表格对 Pandas 常用的统计学函数做了简单的总结:
| 函数名称 | 描述说明 |
|---|---|
| count() | 统计某个非空值的数量。 |
| sum() | 求和 |
| mean() | 求均值 |
| median() | 求中位数 |
| mode() | 求众数 |
| std() | 求标准差 |
| min() | 求最小值 |
| max() | 求最大值 |
| abs() | 求绝对值 |
| prod() | 求所有数值的乘积。 |
| cumsum() | 计算累计和,axis=0,按照行累加;axis=1,按照列累加。 |
| cumprod() | 计算累计积,axis=0,按照行累积;axis=1,按照列累积。 |
| corr() |

这篇博客探讨了描述统计学在Pandas库中的应用,重点介绍了如何使用Pandas进行数据的描述性分析,包括sum(), cumsum(), std()等函数的用法,以及describe()函数在不同数据类型上的应用,如对数字列和字符列的统计信息摘要。通过示例展示了如何指定axis参数进行行或列的操作,并提到了include参数在选择统计列类型时的作用。"
132879737,19694669,Python操作MySQL数据库:读写实战指南,"['数据库', 'Python', 'MySQL', '数据处理']
最低0.47元/天 解锁文章
642

被折叠的 条评论
为什么被折叠?



