描述性统计分析:概念、计算与应用
1. 描述性统计指标概述
描述性统计是数据分析的基础,它能帮助我们从数据中提取关键信息,了解数据的集中趋势、离散程度和分布形状。常见的描述性统计指标包括平均偏差、标准差、四分位差、偏度和峰度等。
1.1 平均偏差
平均偏差用于衡量数据相对于均值的离散程度。对于样本数据集,平均偏差的计算公式为:
[
\frac{\sum_{i=1}^{n} |x_i - \bar{x}|}{n}
]
其中,(x_i) 是每个数据点,(\bar{x}) 是均值,(n) 是数据点的数量。
对于频率分布表,平均偏差的计算公式为:
[
\frac{\sum_{i=1}^{k} |x_i - \bar{x}| f_i}{\sum_{i=1}^{k} f_i}
]
其中,(x_i) 是组中值,(f_i) 是频率,(k) 是组数。
以下是一个频率分布表的示例:
| 组限 | 频率 | 组中值 | 组中值×频率 | (|组中值 - 均值|) | (|组中值 - 均值|×频率) |
| — | — | — | — | — | — |
| 1000 - 1200 | 27 | 1100 | 29700 | 537.821 | 14521.2 |
| 1200 - 1400 | 74 | 1300 | 96200 | 337.821 | 24998.7 |
| 1400 - 1600 | 42 | 1500 | 63000 | 137.821 | 5788.46 |
| 1600 - 1800 | 65
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



