- 博客(7)
- 收藏
- 关注
原创 统计案例分析1.4
案例1.4 三个产业生产总值的描述性分析一、需求:分析三个产业总值之间的关系以及生产总值分布的特征。要求通过本案例的学习,学会分析数据,选择合理的图形对数据进行展示和描述。熟练掌握各描述统计量的特点和应用条件,并能选择合适的统计量对数据进行分析。二、案例分析三个产业生产总值的相关性分析散点矩阵图(也称SPLOM,或Scatterplot Matrix):当欲同时考察多个变量间的相关关...
2019-09-15 21:38:33
3250
原创 scrapy爬虫,一直爬,一直爽(豆瓣电影为例子)(学习笔记)
我的scrapy爬虫,一直爬,一直爽1.python(注意自己安装的版本)2.lxml3.Twisted4.zope.interface5.PyOpenSSL6.pywin32当面对一些包不能用pip install XXX的形式安装时,要到whl文件安装whl文件,下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml。注意,...
2019-09-14 23:56:21
944
原创 随机森林_python
随机森林:用随机的方式建立森林,森林由许多决策树组成,而且每一棵树之间是没有关联的。得到森林以后,当有一个新的输入样本进入的时候,就让森林中的每一棵树分别进行判断,看看这个样本属于哪一类,再看看哪一类被选择最多,就预测这个样本为哪一类。随机森林构建并不是简单地把所有决策树并起来取个平均,其特点体现在随机上,包括两部分的随机:1.随机选取样本集的数据进行构造树(样本可能会重复);2.随机选取特征进...
2019-09-14 23:52:22
347
原创 广义最小二乘估计
最小二乘估计的使用前提总是假设线性回归模型的误差是等方差且不相关的,即Cov(e)=σ2ICov(e)=\sigma ^{2}ICov(e)=σ2I,虽然在许多情况下,这个假定可以认为近似地成立,但有时我们的确要考虑假定不成了时的情况。为了讨论的简单,我们假定以下的的Σ\SigmaΣ(正常情况下是有参数的)是完全已知的。我们讨论的模型:{y=Xβ+e,(∗)E(e)=0,Cov(e)=σ2Σ\...
2019-05-03 22:08:26
14673
2
原创 复共线性岭估计
复线性首先引入均方误差MSEMSEMSE进行评价一个估计的优良的标准MSE(θ~)=trCov(θ~)+∥Eθ~−θ∥2MSE(\tilde{\theta })=trCov(\tilde{\theta })+\left \| E\tilde{\theta }-\theta \right \|^2MSE(θ~)=trCov(θ~)+∥∥∥Eθ~−θ∥∥∥2即均方误差等于分量方差之和再加上一有偏...
2019-05-02 20:12:42
1495
原创 时间序列——MA(q)模型
基本概念在讨论时间序列的MA(q)模型前,我们首先了解以下相关的概念1、协方差:反映的是随机变量之间的关系,类似协方差函数,在时间序列里,我们可以给出自协方差的概念。因为时间序列是一维的,没法找到一个别的数据和自己比较,于是只能和自己慢几拍的(滞后期)数据进行比较,所以有了自协方差数据。$$KaTeX parse error: Expected & or \\ or \cr or \...
2019-04-26 21:26:57
31851
原创 多元回归
多元回归多元线性回归模型的基本假定为了方便地进行模型的参数估计,我们对以下回归方程式有如下假定:Y^=Xβ+ε\hat{Y}=X\beta+\varepsilonY^=Xβ+ε解释变量x1,x2,⋯ ,xpx_1,x_2,\cdots,x_px1,x2,⋯,xp 是确定性变量,不是随机变量,且要求rank(X)=p+1<nrank(X)=p...
2019-04-13 21:02:58
4216
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人