今日课程内容
-
内容回顾
-
作业讲解
-
描述分析
描述性统计
交叉表制作
异常值检验
-
推断统计
内容回顾
描述性统计
1.统计数据的基本概念
统计数据的分类:分类数据、顺序数据、数值型数据
统计量:
集中趋势:均值、众数、中位数、四分位数
离散程度:极差、四分位差、异众比率、方差、标准差
分布描述:峰度、偏度
左偏
右偏
平坦
尖峰
2.频率、频数分析
作业讲解
1.对员工信息表的学历和级别做交叉表分析,查看结果(收入)。
描述分析-交叉表(学历-级别)
对收入进行个案加权
2.分析公司网络数据报表按照每旬的日消费和主产品收入,查看结果
先对数据按照月旬进行分组
再对日消费和主产品收入进行描述分析
描述性统计
1、Z-标准化
公式:数据与平均数的差值除以标准差的过程。z=(数据-均值)/标准差
作用:对比数据,发现数据的异常(-3 ~ 3)
推断统计
推断统计是研究如何利用样本数据来推断总体特征的统计方法:
1.假设检验
2.参数检验
3.非参数检验
基本概念:
总体
样本
总体参数:包括总体均值、总体标准差...
统计量:样本统计量
通过样本统计量推断出总体参数。
推断统计数:
参数估计
利用样本统计量推断总体参数,总体参数在推断之前是未知的。
假设检验
总体参数已知,通过样本结果来验证总体参数的正确性。
假设检验分为:
T检验
非参数检验
参数估计:
点估计:统计量代表总体参数
区间估计:在点估计的基础上,给出范围,该范围称为置信范围,通过参照总体数据在置信范围的
比例,称为置信水平,或置信度(置信系数)
参数检验VS非参数检验
参数检验是已知分布,对参数进行假设
非参数检验总体分布未知,对分布进行假设
假设检验:
零假设:H0(你想反对的结果)
对立假设:Ha(你想看到的结果)
# 案例:中国人的身高为180
零假设:H0=180
对立假设:Ha不等于180
对立假设分为:单尾检验、双尾检验
# 中国人的平均工资是3500
H0 = 3500
Ha不等于3500
假设检验的操作
1.先提出零假设
2.计算发生的概率P值
3.p值在(1-5)%之间,假设不成立,推翻原命题。
#############################
1、假设检验-平均值检验
案例:检验数据-9月和10月的数据有没有差异。
练习:检验数据上旬-中旬-下旬的数据是否有差异
2、单样本T检验
推断样本与指定检验值是否有差异
3、两独立样本T检验
检验2个样本之间是否存在显著差异
作业
1.检验大悦城数据,通过单样本T检验,检验今年的数据值。
推断样本与检验值是否有差异
2.通过样本数据检验,新药对比常药要是否有效。
检验新药与旧药之间是否存在显著差异,判断新药的有效性
本文介绍了统计学的基础概念,包括描述性统计与推断统计,详细解析了统计数据的分类、统计量的计算方法及应用场景,并通过具体案例展示了假设检验的过程。
606

被折叠的 条评论
为什么被折叠?



