
统计学
文章平均质量分 53
统计学
YJ语
这个作者很懒,什么都没留下…
展开
-
统计学中的线性回归
文章目录1 线性回归的基本假设2 线性回归2.1 简单线性回归2.1.1 简单线性回归模型2.1.2 线性回归图像2.1.3 如何求模型的参数呢?--- 最小二乘法2.1.4 如何评估模型的好坏呢?--判定系数 r^22.2 多元线性回归2.2.1 多元线性回归定义2.2.2 多元线性回归参数求解2.2.3 多元判定系数 R^22.2.4 线性回归中,如何提高R^2?2.3 R^2和p值2.4 多重共线性问题3 常见分布3.1 连续型随机变量的分布3.2 离散型随机变量的分布4 总结1 线性回归的基本假设原创 2021-05-27 08:01:03 · 1764 阅读 · 0 评论 -
统计学中的方差分析
文章目录1.0 方差分析1.1方差分析概念1.2 单因素方差分析1.2.1 单因素方差分析1.2.2 方差分析基本数语1.2.3 造成误差的原因1.3 方差分析的3个假定1.4 方差分析的步骤2.0 总结1.0 方差分析1.1方差分析概念通过对数据误差来源分析 检验 各总体的均值是否相等,来判断分类型自变量 对 数值型因变量是否显著影响。1.2 单因素方差分析只有一个因素的方差分析,涉及分类型自变量和数值型自变量两个变量。1.2.1 单因素方差分析在单因素的方差分析中我们涉及两个变量:一个是原创 2021-05-26 10:23:17 · 1954 阅读 · 0 评论 -
统计学中的假设检验
文章目录样本推测总体1.0 抽样和区间估计1.1 点估计1.2 均值抽样分布1.3 置信区间(总体均值的区间估计)2.0 假设检验步骤2.1 步骤2.2 步骤中统计量的选择2.3 判断方法2.4 相关概念2.5 一二类错误2.6 对总体均值进行假设检验时样本容量的确定3.0 假设检验3.1 有关总体参数u的假设检验3.2 检验两个或多个变量之间是否关联3.3 有关参数方差σ2的假设检验3.4 方差分析4.0 总结样本推测总体1.0 抽样和区间估计1.1 点估计有样本均值估计总体均值有样本方差估计总原创 2021-05-25 09:38:46 · 2067 阅读 · 0 评论 -
统计学的描述统计
统计学1.0 描述统计1.1 峰度、偏度均值 < 中位数 ,左偏中位数 < 均值 ,右偏1.2 相关性分析单变量分析双变量分析4.12皮尔逊相关系数(person)(强调的是可能性)目的:计算两个数值型数据之间的线性关系,当两个变量之间的关系是非线性时,相关系数为0.取值范围:[-1,1],正数代表正相关,负数代表负相关。相关系数分类:0.8 - 1.0(极强相关);0.6 - 0.8(强相关);0.4 - 0.6(中等程度相关);0.2 - 0.原创 2021-05-24 11:11:55 · 942 阅读 · 0 评论 -
回归分析的假设前提
参考:https://blog.youkuaiyun.com/Noob_daniel/article/details/76087829原创 2021-04-26 11:18:52 · 909 阅读 · 0 评论 -
抽样与区间估计 假设检验 线性回归 统计学基础知识
统计学抽样与区间估计假设检验线性回归卡方检验和方差分析统计学基础知识抽样与区间估计假设检验线性回归卡方检验和方差分析统计学基础知识原创 2021-04-09 23:10:16 · 281 阅读 · 0 评论 -
统计学基础知识
统计学基础知识视频参考:http://open.163.com/newview/movie/free?pid=M82IC6GQU&mid=M83JBFVGI笔记参考:https://www.jianshu.com/p/b509477fba1chttps://www.cnblogs.com/Joeyyoung/p/10212733.html常见图形箱线图总体与样本一元样本-期望E(X)随机变量的期望值其实是总体的均值,但有时由于总体样本无限多,用均值计算方法很难原创 2021-04-03 23:46:38 · 2254 阅读 · 0 评论 -
假设检验-U检验、T检验、F检验、卡方检验
参考博客:https://blog.youkuaiyun.com/qq_22592457/article/details/92982170原创 2021-04-02 10:59:40 · 465 阅读 · 0 评论 -
卡方检验
原创 2021-04-01 08:37:53 · 194 阅读 · 0 评论 -
置信区间和置信水平
易错点强调:什么是置信区间和置信水平?置信区间?95%置信区间应该这样理解:做100次相同的抽样,计算置信区间,那么你计算的区间内包含整体均值的概率是95%。置信区间描述的是随机抽样的可信度,说白了就是证明你抽样给出的结论为啥是靠谱的。例如,我们有99%的几率相信,[48.8,64.8]的区间内包含了总体均值。求解具体的步骤:确定要求解的问题是什么比如我们想要通过样本来估计总体的平均值求样本的平均值和标准误差注意:总体,样本,样本均值抽样分布是3个东西,一定要区分开。计算样原创 2021-03-31 14:48:57 · 3742 阅读 · 0 评论 -
大数定律和中心极限定理
1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。所以,第5次正面的机会只有1/32,而不是1/2。以上混淆了“在硬币第1次抛原创 2021-03-30 10:16:52 · 8769 阅读 · 0 评论 -
01分布_二项分布(Beta分布)_多项分布(Dirichlet分布)
01分布设p是随机变量等于1的概率,伯努利分布有一些特殊的性质:前提基础伯努利分布是离散型,并且是一个0/1变量它的数学期望是:方差是:二项分布前提要求:求解:多项式分布前提要求:求解:Beta分布beta分布可以看作一个概率的概率分布(哪个概率?----二项分布的概率)参考:https://blog.youkuaiyun.com/a358463121/article/details/52562940Dirichlet分布beta分布可以看作多项分布概率的概率分布参考:h原创 2021-03-29 09:56:30 · 6808 阅读 · 0 评论 -
极大似然估计
统筹极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。通俗来讲就是利用一堆的数据样本(x,y),根据样本的分布规律可以假设出数据的模型,列如:正态分布、布尔分布等。由于这些模型中的表达式子是知道的,但是里面含一些θ的未知参数,极大似然估计的目的就是由样本数据推算出最合适的θ参数。估计:是对一些事情就是估计矩估计:利用已有样本估计期望值的一种方法戴帽子的等号表示估计。每个xi都是一个简单随机样本,并且我们认为每个样本都是等可能的,这实际上是真实世界中一种不得已原创 2021-03-28 08:14:09 · 219 阅读 · 0 评论 -
协方差与相关系数的区别和联系
协方差:协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。相关系数:研究变量之间线性相关程度的量,取值范围是[-1,1]。总结:相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。...原创 2021-03-23 22:58:36 · 1153 阅读 · 0 评论 -
渐进抽样
常见的抽样方法:1 有放回的简单随机抽样2 无放回的简单随机抽样3 分层抽样每种抽样有适合的场景,那什么是渐进抽样?在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是渐进抽样。举个例:比如,使用渐进抽样学习一个预测模型,预测模型的准确率会随着样本容量的增加而增大,直到某一点之后趋于稳定,此时的样本容量为适合的样本容量,我们可以选取接近当前容量的其它样本,估计出与稳定点的接近程度,从而停止抽样。...原创 2021-03-17 16:30:10 · 2627 阅读 · 0 评论