数据分析统计学基础笔记

本文介绍了数据分析统计学的基础概念,包括均值、标准差、正态分布和中心极限定理。通过实例解释了中心极限定理在统计全国体重中的应用。接着,讨论了置信区间、线性回归、方差分析、各种类型的统计图表(如条形图、折线图、饼图、散点图等)以及它们在实际问题中的应用,如水房拥挤问题、误差分析和概率分布。此外,还提到了茎叶图、箱线图、P-P图、Q-Q图等特殊图表及其用途。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

·av68916814

 

·均值

 

·标准差:偏离均值

 

·正态分布:最高点为均值 95%的数据处在两个标准差之间 可查表

 

·中心极限定理:n次取样,无论全体是什么分布,样本均值是正态分布

例子:(原文链接:https://blog.youkuaiyun.com/qq_25366173/article/details/80151629)

现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理说:这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。 最后,当我们再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。
应用:水房拥挤问题(原文链接:https://wiki.mbalib.com/wiki/%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86

 

·置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度。

 

·线性回归: y=ax+b

 

·方差分析:通过组间方差与组内方差的对比来判断分组是否准确

 

·象形统计图:表现统计数字大小和变动的各种图形总称。其中有条形统计图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值