目录:
5.1 描述性统计分析
(1)基本统计学概念
- 总体
- 样本
(2)统计量
可以在一定程度上反应总体的特征,从样本数据中计算得到,常见统计量包括:
- 均值
- 标准差
- 中位数
- 分位数
- 众数
(3)离散程度
统计量可以对数据有个大体的认识,仅反应了数据的某些趋势,常见的离散程度有:
- 极差
- 四分位差
- 方差
- 变异系数
import pandas as pd
import os
os.chdir(r'C:\Users\Administrator.DESKTOP-0L8IC5U\Desktop\数据分析\data')
insuance = pd.read_csv('train.csv', encoding='utf-8', dtype={
'Gender': 'str'})
a = insuance['Age'].mean()
b = insuance['Age'].std()
c = insuance['Age'].median()
d = insuance['Age'].quantile([0, 0.05, 0.25, 0.5, 0.75])
print(a, '\n', b, '\n', c, '\n', d

本文介绍了描述性统计分析的关键概念,包括基本统计学概念如总体与样本,统计量如均值、标准差、中位数等,以及离散程度的衡量。此外,详细讲解了点估计与区间估计,通过实例展示了如何利用样本数据进行点估计,并应用中心极限定理进行95%置信区间的计算。接着,文章概述了假设检验的基本步骤,并给出了单样本和双样本t检验的Python实现示例。
最低0.47元/天 解锁文章
&spm=1001.2101.3001.5002&articleId=117332098&d=1&t=3&u=7bd24eeba23e41fbabc143d5497d866d)
1481

被折叠的 条评论
为什么被折叠?



