
R
羊城迷鹿
你相信魔法吗?(广东某魔法学院毕业生,欢迎私信交流最新咒语、魔药配方和炼丹秘笈)
展开
-
Rstudio如何设置快速提示
今天真是醉了,用 Rstudio 打码的时候,发现代码提示都输出地好慢哦,于是费了九牛二虎之力,终于调出了快速提示的感觉。 Tools->Global Options-↓ ...原创 2018-07-28 22:56:37 · 3968 阅读 · 3 评论 -
主成分分析法数学原理与使用
文章目录数学原理的大致解释进一步讨论R语言使用实例数学原理的大致解释进一步讨论根据上面对PCA的数学原理的解释,我们可以了解到一些PCA的能力和限制。PCA本质上是将方差最大的方向作为主要特征,并且在各个正交方向上将数据“离相关”,也就是让它们在不同正交方向上没有相关性。因此,PCA也存在一些限制,例如它可以很好的解除线性相关,但是对于高阶相关性就没有办法了,对于存在高阶相关性的数据...转载 2019-04-01 16:40:51 · 590 阅读 · 0 评论 -
广义线性拟合的参数解释
普通线性拟合和广义线性拟合的区别在于,前者可以简单地表示为Y=a0+a1x1+a2x2+...anxnY = a_0+a_1x_1+a_2x_2+...a_nx_nY=a0+a1x1+a2x2+...anxn,而后者则是Y=l(a0+a1x1+a2x2+...anxn)Y =l(a_0+a_1x_1+a_2x_2+...a_nx_n)Y=l(a0+a1x1+a2x2+......原创 2019-03-15 01:30:59 · 1172 阅读 · 0 评论 -
R 实现长表和宽表的转换
大佬写的真好转载 2018-12-09 23:07:18 · 4240 阅读 · 0 评论 -
R之踩坑:&与&&的区别
今天有个任务,要计算成绩落在所有成绩的均值加减标准差内的成绩占所有成绩的比重,于是首先算出均值和标准差(就这我还踩了好久的坑,太菜了太菜了):# grade是dataframe类型的sd_grade <- sd(as.numeric(unlist(list(grade))))mean_grade <- mean(as.numeric(unlist(list(grade))))...原创 2018-12-09 22:16:45 · 1699 阅读 · 0 评论 -
如何从列联表获得对应分析的结果
对应分析所针对的原始数据必须有行向量和列向量, 在轻松获得所感兴趣的两个变量组成的列联表之后, 要进行多步转换,才能获取结果.获取列联表 Sub1 <- data.frame(F$自评成绩, F$可能性) %>% table F.可能性F.自评成绩 完全有可能 有可能 不确定 不可能 完全不可能 90~100分 13 ...原创 2018-09-03 20:30:52 · 2857 阅读 · 0 评论 -
运用卡方检验(独立性检验)来分析问卷的两个问题之间的关联性
卡方检验是以χ2分布为基础的一种常用假设检验方法,它的零假设H0是:观察频数与期望频数没有差别。该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小(一般认为是小于5%),说明观察值与理论值偏离程度太大,应当拒绝零假设,表示比较资料之间有显著差异;否...原创 2018-08-17 15:26:42 · 20904 阅读 · 1 评论 -
转载:R语言分词包jiebaR
http://blog.fens.me/r-word-jiebar/转载 2018-08-18 22:35:42 · 418 阅读 · 0 评论 -
对问卷数据进行线性分析
引入包library(dplyr)library(ggplot2)library(tidyr)绘制时间序列图原始数据:可以看到日期是字符串形式,现在将其转换为数值型menus <- read.csv(file.choose(), stringsAsFactors = FALSE, colClasses = c('factor', 'Date', 'numeri...原创 2018-08-18 21:35:40 · 3831 阅读 · 1 评论 -
R语言中的均值差异检验/t检验的结果解读
T 检验是用于小样本(样本容量小于 30)的两个平均值差异程度的检验方法。它是用 T 分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著,常被应用于小样本判断的置信度。最常用 t 检验的情况有:单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群军校男生的身高的平均是否符合全国标准的 170 公分界线。双样本检验:其零假设为两个正态分布的总体的均值...原创 2018-08-15 15:44:21 · 24198 阅读 · 0 评论 -
R语言读取Excel文件的一系列陷阱
你想用R读取一个Excel文件,你觉得这事没啥难的,就像所有的文件读取,只需要知道文件名就万事大吉了。 于是,你把1.xls放到读取.R的文件夹下面,重命名为1.csv,打开rstudio,执行下面这条语句a <- read.csv("1.csv")出现了下面的报错Error in file(file, "rt") : cannot open the connectionI...原创 2018-08-15 00:17:04 · 14583 阅读 · 1 评论 -
R语言一些比较神奇的运算符
取余、相除、相除求商(相除可以看做是C语言里面的浮点数相除,相除求商可以看做是C语言里面的整数相除) &是对两个向量里面的所有元素分别判断是否都为true,而&&就只针对两个向量里面的第一个元素,因此在这种情况下,两个向量的长度可以是不相等的。 %in%用来标识一个元素是否位于某个向量之中,或者说,是否属于某个集合。但它不能判断一个集...原创 2018-08-05 22:26:10 · 2791 阅读 · 0 评论 -
R语言的一波小技巧
如何清除变量已经习惯了 MATLAB 的我先输入了个 clear() ,咦,怎么没反应。查阅了资料才发现,R 里面的清除使用的是完全不一样的方法。 删除变量 a : rm(a) 删除全部变量:rm(list=ls())如何多行注释单行注释是很简单的,使用#即可,但是多行又应该怎么办呢?if(FALSE) { ···爱写啥写啥···}如何新建脚本按住ctrl...原创 2018-07-27 15:48:05 · 429 阅读 · 0 评论 -
R语言入门
为了增强自己在数据分析方面的能力,本假期计划自学完成 R 和 Python 这两门编程语言。然鹅已经有了一定基础的 Python 学习起来进展很快,R 语言却迟迟不见动静。因此我决定要把学习的路线图记录下来,也作为对持续性学习的一种激励。 在线学习网站 : w3cschool安装步骤没有什么特别,无非就是包然后设置环境变量之类,为了进一步方便学习,我还下载了 RStudio 作...原创 2018-07-26 11:50:44 · 1825 阅读 · 0 评论 -
R语言数据类型大汇总
基本数据类型#逻辑型变量赋值l <- TRUEprint(class(l))#数值型变量赋值n <- 100print(class(n))#整数型变量赋值i <- 100Lprint(class(i))#复合型变量赋值j <- 3+2iprint(j)print(class(j))#字符型变量赋值c <- 'hhh'print(cla...原创 2018-07-28 23:26:09 · 9925 阅读 · 3 评论 -
因素负荷量(factor loadings)的理解
在因子分析里,有个词叫因子载荷(factor loadings),此词简单地说就是个别变数与因子之间的相关性(没转轴前),所以这个值如同Pearson correlations一样,数值介于- 1至1之间。因子载荷的平方也就是这个因子可以解释多少这个变数。举例来说,如果因子载荷是0.4,那表示该因子可解释此变数0.16的variance。由于一个因子会与多个变数相关,所以因子载荷也可以解读成:这...转载 2019-04-19 16:25:34 · 48768 阅读 · 2 评论