描述性统计分析
提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
统计学及描述性统计
统计学的两个分支:描述性统计和推断性统计
统计学是应用数学的一个分支,涉及从定量数据中手机、描述、分析和推断结论。统计学背后的数学理论在很大程度上依赖于微积分、线性代数和概论率。统计学的两个主要领域被称为描述性统计和推断性统计
描述性统计描述样本和总体数据的属性。
推断性统计使用这些属性来检验假设并得出结论。
描述性统计的主要内容
集中趋势:均值,中位数,众数
波动性:方差,标准差,Z分值
集中趋势
平均值
平均值用于衡量某个数据集的中心位置,他的缺点是易受异常值影响,因此求平均数之前需要首先处理异常值。
中位数/四分位数
将数据集排序后分为两部分,处于正中间位置的数据就是中位数;将数据集划分为四部分,这种划分的临界点就是四分位数,包括下四分位数(25%)和上四分位(75%)。
中位数和四分位数不易受极端值影响,因此,当有极端值存在时,中位数能比平均数
更有效地反映出数据的中心位置。
众数
众数是一组数据中出现最多的数,不易受到极端值影响。
分组与平均值
罗杰斯Will Rogers悖论,是指将某些事物从一个组移到另