
数据分析与挖掘
文章平均质量分 67
XMU_math_doctor
南京航空航天大学毕业本科生,厦门大学在读博士生
展开
-
南航数据分析与挖掘作业2
回归系数依旧是4.425,但是参数检验中p值增大(但是依旧足够小,回归依旧高度显著)所以X1和X2可能有很强的相关性,所以导致删除X2后模型依旧显著。3.7(1)直接对所有参数做线性回归:进行逐步回归:逐步回归得到的线性回归方程中,保留了x1,x2,x3.但是x3不够显著,所以只对x1,x2进行回归。所以最优的回归方程为:Y=53.00609+1.41589X1+0.65029X2(2)p值为1.58e-9,95%置信区间运行结果:(3)红圈为观测值,蓝点为预测值...原创 2021-01-11 18:45:27 · 916 阅读 · 0 评论 -
南航数据分析与挖掘作业1
知识点:直方图:数据取值范围分成若干区间,区间长度为组距,高度的频率/组距,这样直方图总面积为1。直方图可以对总体概率密度f(x)进行估计,这就是拟合分布曲线。(4)茎叶图:The decimal point is 1 digit(s) to the right of the |12 | 0312 | 6788913 | 112224413 | 55567777788889999914 | 011222222334414 | 556667777899915 | 01知识点:...原创 2021-01-11 18:32:27 · 899 阅读 · 0 评论 -
南航数据分析与挖掘重点整理
数据分析与挖掘重点整理每年重点都差不多,不过还是要以老师为主(如果老师划重点的话),该重点是本人结合老师所划重点,以及老师上课讲课时,相应知识点所花时间来整理的,题主数据分析与挖掘拿到了97分(虽然不高,但也可以说明该份重点还算有效)Charp11.1数据的数字特征:均值,方差,中位数1.2二元数据的数字特征Charp33.1离差平方和3.2Charp44.1主成分4.2证明4.3证明因子矩阵A不唯一4.4参数估计法Charp55.1信息增益算法原创 2021-01-11 18:05:44 · 722 阅读 · 4 评论 -
南航数据分析与挖掘课设1(下)——基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测(R语言代码附录)
1.GDP1.R#先做这个GDP1 <- read.table("GDP.txt",header=TRUE)GDP1reg1 <- lm(y~x1+x2+x3+x4+x6+x7+x8, data=GDP1)summary(reg1)reg1.Stepwise <-step(reg1,direction="both")summary(reg1.Stepwise)##说明GDP和x7,x8有关2.GDP.R#接GDP1.RGDP <- read.table("GD原创 2021-01-11 17:23:30 · 1361 阅读 · 0 评论 -
南航数据分析与挖掘课设1(上)——基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测(R语言)
基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测摘要在国民经济发展的过程中,国内生产总值(GDP)是指按国家市场价格计算的一个国家(或地区)所有常驻单位在一定时期内生产活动的最终成果,常被公认为是衡量国家经济状况的最佳指标。国内生产总值GDP是核算体系中一个重要的综合性统计指标,也是我国新国民经济核算体系中的核心指标,它反映了一国(或地区)的经济实力和市场规模。目前,我国正处于经济发展新常态的关键阶段,前期结构调整留下后遗症仍待解决,各方面经济发展的压力不可小觑。因此本文使用了国原创 2021-01-11 17:17:37 · 3621 阅读 · 0 评论