预测算法模型系列(四)

本文介绍了方差检验的基础知识,通过分析方差、组间和组内平方和来评估数据波动和相关性。在大数据预测模型中,方差检验用于判断自变量和因变量之间的关系强度,涉及计算方差值、概率值和影响程度系数。文章讨论了如何通过Java计算概率值,并解释了如何根据计算结果做出相关性结论。

方差检验

什么是方差?这个知识点最基础的概念可以看一下初中课本,《人教版数学八年级下册》

【微课】人教版八年级数学下册20.2.1《方差》图文精讲(含视频、电子教材、知识点、课件、习题)

给出一组数据,先算出整体平均数,然后用每个数和平均数的差的平方,累计起来再求一次平均,这个平均数就反应了这组数据中的波动情况,它就是这组数据的方差。

  • 例如下图,连续7天的温度检测,可以看到两组数据的波动不同,蓝色的气温比较稳定,绿色的昼夜变化差异较大。

我们可以理解为变化波动小的这组数据比较稳定,每一个数和平均值之间相互关系更紧密一些。变化差异大的那组数据和平均值好像就没那么紧密了。利用这个观点,我们如果能判断出两组数据之间的差异比较小,那是不是就可以理解为这两组数据他们之间是有相互影响的呢?答案是肯定的啦。

所以使用差方再求平均的方法计算两组数的差异化就是方差检验。

那就是用两组数据,一对儿一对儿的计算差方,求平均吗?

不不不~~~    这么算,体现不出两组数据的差异波动。

那方差怎么算呢,具体的计算过程需要如下处理:

  1. 数据准备
  2. 基础数据计算
  3. 方差值、概率值计算
  4. 结论计算

一、数据准备,如下处理:

前提条件是自变量数据和因变量数据条数一致,根据某种关系能把自变量和因变量一一对应上。

1、要求出定量数据的整体平均数\overline{X}

2、对定类数据进行归类\left [ a,b,c,... \right ],共k组,然后把定量数据,根据归类来分组

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值