
统计学
补充统计学相关知识
不停下脚步的乌龟
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据的变量类型及其之间的关系
怎么理解【分类变量,顺序变量,数值型变量】和【定类变量,定序变量,定距变量,定比变量】和【离散变量,连续变量】之间的关系?变量划分划分依据备注定类/定序/定距/定比根据数据测量的尺度或者说是数据的作用而划分出来的如定类数据就是指该数据是以“类别”作为测量尺度,是用来为数据分类的分类/顺序/数值根据数据属性而划分出来的也有将顺序变量归为类别变量的离散/连续数值型变量的数字特征是对数值型变量的进一步划分...原创 2021-06-03 18:58:42 · 2150 阅读 · 0 评论 -
【聚类方法】
直接上自己之前记的笔记原创 2020-03-06 19:04:14 · 540 阅读 · 0 评论 -
【回归模型中两变量相乘】交互作用,调节作用
在一些回归模型中,我们常看到回归方程中有两个变量以相乘的形式出现,如:yprice=β0+β1producttype+β2productbrand+β3producttype∗productbrand+μ(1)y_{price}=\beta_0+\beta_1producttype+\beta_2productbrand+\beta_3producttype*productbrand+\mu(1)yprice=β0+β1producttype+β2productbrand+β3productt.原创 2020-11-09 18:07:10 · 11985 阅读 · 0 评论 -
【异方差】定义与检验
1. 定义被解释变量观测值的分散程度(方差)随着解释变量的变化而变化(异)2. 检验异方差问题检验,每次只检验一个解释变量小样本用t检验,大样本用F检验检验值>查表值,存在异方差...原创 2020-11-06 13:00:10 · 2767 阅读 · 0 评论 -
【x与y的非线性关系】回归,自变量,自变量的平方项,自变量的二次项
参考资料:连享会《平方项 = 倒U型 ?》(文章链接)该文章为自学总结,大佬请忽视1. 什么情况下要研究x与y的非线性关系?假设我们要研究:喝水越多身体越健康吗?在这里,喝水量为自变量,身体健康度(假设有该指标)为因变量。常识告诉我们,适当喝水有益于身体健康,但是一旦饮水过度,反而会导致水中毒,损害身体健康。所以,喝水量(x)对身体健康度(y)的影响并不是线性的,而是呈倒“U”状:随着x的增加,y先增加后减少。综上,便是我们为什么在一些回归模型中看到某个自变量xxx和x2x^2x2同时出.原创 2020-11-05 20:42:26 · 10032 阅读 · 1 评论 -
【统计学】置信区间
假设我们想直到1000个人的平均身高。但是对1000人分别进行身高测量太麻烦。所以我们选择100人样本进行估计。估计可以是点估计(估计确切身高数),也可以是区间估计(估计确切身高的范围)区间估计更为科学,所以这里我们选择区间估计。要估计就要考虑估计的准确度,我们实现确定95%的估计准确度。95%准确度对应的统计量为1.96然后我们对100人样本求他们的平均身高x‾\overline x...原创 2020-03-20 11:29:33 · 1347 阅读 · 0 评论 -
【统计学】中心极限定理
假设有1000名学生(总体),平均身高是176cm。现在对该总体进行随机抽样,一次抽50人,共抽30次。对于每一次抽样,都能求得样本(50人)的平均身高,最终会获得30个样本的平均身高。中心极限定理:30个样本(20个平均身高)组合起来服从正态分布。30个样本的平均身高的平均值近似等于总体的平均身高。通过上述例子,中心极限定理大概就是说:无论总体呈什么分布,来自总体的每个样本的平均值合起...原创 2020-03-19 16:49:30 · 1661 阅读 · 0 评论 -
【统计学】经验法则与切比雪夫法则
1. 经验法则使用条件数据分布服从或近似服从正态分布原创 2020-03-17 14:15:22 · 6315 阅读 · 1 评论