描述性统计分析——笔记

本文是关于描述性统计分析的笔记,涵盖了统计学的基础概念,包括描述性统计与推断性统计的区别。文章深入探讨了集中趋势的度量(如均值、中位数和众数),波动趋势的表示(如方差和标准差),以及数据的度量和概率。此外,还讲解了概率分布和相关性分析,如生日悖论和相关系数的计算,强调了相关性并不一定意味着因果关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

描述性统计分析


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


统计学及描述性统计

统计学的两个分支:描述性统计和推断性统计

统计学是应用数学的一个分支,涉及从定量数据中手机、描述、分析和推断结论。统计学背后的数学理论在很大程度上依赖于微积分、线性代数和概论率。统计学的两个主要领域被称为描述性统计和推断性统计
描述性统计描述样本和总体数据的属性。
推断性统计使用这些属性来检验假设并得出结论。

描述性统计的主要内容

集中趋势:均值,中位数,众数
波动性:方差,标准差,Z分值

集中趋势

平均值
平均值用于衡量某个数据集的中心位置,他的缺点是易受异常值影响,因此求平均数之前需要首先处理异常值。

中位数/四分位数
将数据集排序后分为两部分,处于正中间位置的数据就是中位数;将数据集划分为四部分,这种划分的临界点就是四分位数,包括下四分位数(25%)和上四分位(75%)。
中位数和四分位数不易受极端值影响,因此,当有极端值存在时,中位数能比平均数
更有效地反映出数据的中心位置。

众数
众数是一组数据中出现最多的数,不易受到极端值影响。

分组与平均值

罗杰斯Will Rogers悖论,是指将某些事物从一个组移到另

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值