
统计学习
凌少skier
这个作者很懒,什么都没留下…
展开
-
可汗学院 统计学习第一天
12 样本和总体区分四个概念:总体总体均值样本样本均值13&14 总体方差&样本方差方差:描述数据与均值之间的偏离程度15&16 标准差&公式的推导标准差:等于方差的平方根。17 离散随机变量&连续随机变量18 概率密度函数总的概率积分为119-22 二项分布二项分布: 重复n次独立的伯努利试验1次二项分布即为0-1分布定义二...原创 2019-08-05 20:25:05 · 232 阅读 · 0 评论 -
可汗学院 统计学习第二天
35 中心极限定理大数定律表示大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。中心极限定理说是在一定条件下,给定一个任意分布的总体,每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。在实际生活当中,我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数。中心极限定理在理论上保证了我们可以用只抽样一部分的...原创 2019-08-06 18:25:46 · 225 阅读 · 0 评论 -
可汗学院统计学 task 3
假设检验假设检验(Hypothesis Testing):依据一定的假设条件由样本推断总体的一种方法。基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。假设检验分假设和...原创 2019-08-08 21:13:13 · 284 阅读 · 0 评论 -
可汗学院统计学 task4
线性回归:在已有数据集上通过构建一个线性的模型来拟合该数据集特征向量的各个分量之间的关系,对于需要预测结果的新数据,我们利用已经拟合好的线性模型来预测其结果。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。拟合方程使用得比较广泛的有最小二乘法。线性模型在二维空间中就是一条直线,在三维空间是一个平面。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种...原创 2019-08-12 22:01:50 · 213 阅读 · 0 评论