
R
浮豹
因为我不曾见过海洋
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用户续费率预测--R语言逻辑回归实例--附带代码和数据集
复制粘贴就能看懂的模型原创 2020-12-15 18:13:31 · 3639 阅读 · 0 评论 -
R语言----逻辑回归实例(R包mtcars数据集举例)
简单逻辑回归模型可以先参考这篇文章学习下https://blog.youkuaiyun.com/weixin_41744624/article/details/105506951数据预览我们使用的是R自带包mtcars中的数据来举例,其中响应变量(y)是数据集中的"am"异常值检验首先来检查一下数据集的异常值(缺失、离群、重复),需要根据数据的具体情况确认是否去除,本例中不考虑重复值离群值可以选...原创 2020-04-27 10:43:27 · 14152 阅读 · 4 评论 -
R语言 逐步回归分析
逐步回归分析是以AIC信息统计量为准则,通过选择最小的AIC信息统计量,来达到删除或增加变量的目的。R语言中用于逐步回归分析的函数 step() drop1() add1()1.载入数据 首先对数据进行多元线性回归分析tdata<-data.frame( x1=c( 7, 1,11,11, 7,11, 3, 1, 2,21, 1,11,10), x2=c(26,2...转载 2020-04-24 10:40:27 · 11520 阅读 · 0 评论 -
解决R语言xlsx安装遇到问题
一、错误library(“xlsx”)载入需要的程辑包:rJavaError: package or namespace load failed for ‘rJava’:loadNamespace()里算’rJava’时.onLoad失败了,详细内容:调用: dyn.load(file, DLLpath = DLLpath, …)错误: 无法载入共享目标对象‘/Library/Fram...转载 2020-04-21 09:36:28 · 3417 阅读 · 0 评论 -
R语言----决策树与随机森林详解
决策树首先区分树模型和线性模型的区别:线性模型:对所有特征给予权重相加得到一个新的值(例:逻辑回归通过大于某一概率阈值的划分为一类,小于某一概率阈值的为另一类)逻辑回归只能找到线性的分割(输入特征x与logit之间是线性的,除非对x进行多维映射)树型模型:决策树对每一个特征做一个划分决策树可以找到非线性分割树模型拟合出来的函数是分区间的阶梯函数,可以产生可视化的分类规则决...原创 2020-04-16 15:47:37 · 6545 阅读 · 4 评论 -
使用R语言进行时间序列分析
一、时间序列的定义时间序列是将统一统计值按照时间发生的先后顺序来进行排列,时间序列分析的主要目的是根据已有数据对未来进行预测。一个稳定的时间序列中常常包含两个部分,那么就是:有规律的时间序列+噪声。所以,在以下的方法中,主要的目的就是去过滤噪声值,让我们的时间序列更加的有分析意义。二、时间序列的预处理1、平稳性检验:拿到一个时间序列之后,我们首先要对其稳定性进行判断,只有非白噪声的稳定性...转载 2020-04-15 15:10:54 · 6568 阅读 · 0 评论 -
R语言----方差与协方差分析
直接举个栗子:考虑在数据集mtcars中内置的R语言。在其中我们观察到汽车的每加仑英里数(mpg)取决于马力(“hp”)的值。又观察到汽车的每加仑英里数(mpg)也取决于字段“am”表示传输的类型(自动或手动)。 它是值为0和1的分类变量。对于以上,一个样本中的响应变量(因变量y),同时与多个预测变量(因变量x有关),如果有一些你并不真正关心、但有可能对因变量有影响的变量,你的调查研究中你...原创 2020-04-15 14:09:31 · 5663 阅读 · 4 评论 -
R语言----(标准正态&二项)分布
标准分布也即是:正态分布。 在来自独立源的数据的随机集合中,通常观察到数据的分布是正态的。在图中,曲线的中心表示数据集的平均值。 50%的值位于平均值的左侧,另外50%位于图表的右侧。开始前先附一篇下述四个函数的统计学讲解,个人感觉较为详细http://www.360doc.com/content/18/0913/18/19913717_786412696.shtmlR语言有四个内置函数...原创 2020-04-14 16:32:55 · 16115 阅读 · 0 评论 -
R语言----泊松回归
泊松回归包括回归模型,其中响应变量是计数形式。 例如,足球比赛系列中的出生次数或胜利次数。 此外,响应变量(因变量y)的值遵循泊松分布。泊松回归的一般数学方程为 :log(y) = a + b1x1 + b2x2 + bnxn…以下是所使用的参数的描述 :y是响应变量。a和b是数字系数。x是预测变量。glm( ) 函数在泊松回归中glm()函数的基本语法是 :glm(f...原创 2020-04-14 14:19:34 · 2812 阅读 · 0 评论 -
R语言----逻辑回归各统计量解读
逻辑回归是回归模型,其中响应变量(因变量y)具有诸如True / False或0/1的分类值。 它实际上基于将其与预测变量(自变量x)相关的数学方程测量二元响应的概率,作为响应变量的值。逻辑回归的一般数学方程为 :y = 1/(1+e^-(a+b1x1+b2x2+b3x3+…))以下是所使用的参数的描述 :y是响应变量。x是预测变量。a和b是作为数字常数的系数。glm()函数...原创 2020-04-14 13:10:57 · 12443 阅读 · 2 评论 -
R语言----线性回归(一元&多元)
回归分析是一种非常广泛使用的统计工具,用于建立两个变量之间的关系模型。这些变量之一称为预测变量(自变量x),其值通过实验收集。另一个变量称为响应变量(因变量y),其值从预测变量派生。线性回归在线性回归中,预测变量与相应变量通过方程相关,其中这两个变量的指数(幂)为1.数学上,线性关系表示:当绘制为图时的直线。 任何变量的指数不等于1的非线性关系将创建一条曲线。线性回归的一般数学方程为 ...原创 2020-04-14 08:38:37 · 5483 阅读 · 0 评论