Python 中的统计分析与数据处理
在 Python 中,我们可以利用强大的库进行统计分析和数据处理。接下来,我们将深入探讨 stats 模块以及 pandas 库的相关内容。
1. 统计分析: stats 模块
stats 模块是一个重要的工具,它包含了许多统计工具和概率描述,结合 NumPy 的随机数生成器,能让我们完成很多统计工作。
1.1 计算直方图
我们可以通过以下步骤计算随机过程观测值的直方图:
import numpy as np
# 从正态分布中抽取样本
s = np.random.normal(size=1500)
# 定义直方图的区间
b = np.arange(-4, 5)
# 计算直方图
h = np.histogram(s, bins=b, density=True)[0]
这里我们从正态(高斯)分布中抽取样本,并计算指定区间的直方图,同时要求结果是区间上概率密度函数的值。
1.2 计算概率密度函数
我们可以使用 stats 模块计算正态分布的概率密度函数:
from scipy import stats
# 计算区间中点
bins = 0.5*(b[1:] + b[:-1])
# 计算概率密度函数
pdf = stats.norm.p
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



