目录
0. 写在前面
概率统计第二篇,作为补充。主要依据框架记录一下相关的具体概念。
概率统计(1)本质
1. 本质
概率学
|
概率分布
|
统计学
通过随机变量的概率分布可以掌握它的随机特性,从而对它进行预测。而概率分布的获得需要进行试验(抽样)并进行数据记录(统计量)。把样本研究的结果用来反映总体的特征称为“统计推断”
因此,可以说概率分布是连接概率论和统计学的至关重要的桥梁。
2. 内容
2.1 统计量(样本)
2.1.1 集中趋势的度量—— 平均数
注意:平均数不止一种,平均值≠均值
平均值分为数值平均和位置平均。
数值平均又分为普通平均数和加权平均数。
位置平均数分为中位数和众数。
-
均值

这里的公式表示的是普通平均数,加权平均数还需要在分子上每一个x项的前面加一个系数(权重),这个系数的含义是每个x出现的概率大小。
均值无法处理由异常值带来的数据偏斜问题,而中位数是一种解决办法。
- 中位数

如果数据看上去体现了不止一种趋势或者有多批数据,那么平均数或者中位数可能都不再适合描述数据,而是应该考虑众数。 - 众数
当众数的数目较少时,或者数据为类别数据而不是数值型数据时,使用使用众数。

小结:

2.1.2 离散性与变异性的度量——距和差
平均数往往只能反映数据的部分信息(数据中心),但是却无法反映数据的波动情况。
全距/极差
全距的两个问题:
① 易受异常值影响 → 引入四分位距
② 无法确定上下界之间的数据情况 → 引入方差、标准差

本文深入解析概率统计的核心概念,涵盖统计量、概率分布、统计推断等关键领域,阐述平均数、方差、标准差的计算及应用,探讨概率分布类型,详解抽样分布、参数估计与假设检验,辅以实例说明,旨在帮助读者掌握概率统计的基本原理。
最低0.47元/天 解锁文章
403

被折叠的 条评论
为什么被折叠?



