因为工作需要使用R语言,利用周末了解,记录这些属于R的周末
本系列每周末更新,不断修改中
R介绍
- 开源的,源于S语言的,主要用于统计计算和作图的语言.
- 优势: 简单易学,轻量,不同系统上兼容性好,包多,有RStudio这个优秀的IDE
- 劣势: 速度较慢,包质量参差不齐,数据量大的时候性能不好,在深度学习领域缺乏包
R安装
- R官网
- R-3.4.3-win下载链接
- 安装即可
- RStudio官网
- 下载链接
- 安装即可
RStudio使用
- RStudio界面
打开RStudio,左下console是控制台;左上是脚本输入界面;右上是工具栏,分别是环境,历史和连接;右下是多功能台,分别是files:查看文件,plots:显示图型,packages:当前下载和加载的包,help:帮助栏,viewer:数据预览.
- 定制R环境
# 每次执行R时会自动运行的命令,在以下文件中设置
# path="C:/Program Files/R/R-3.3.2/etc/Rprofile.site"
# 运行R时还会载入同目录的.Rprofile文件
# 如果没有还会尝试载入根目录下的.Rprofile文件
# 还可以定义.First函数>
# .First <- function() {
# options(prompt="$ ", continue="+\t") # $ 是提示符
# options(digits=5, length=999) # 定制数值和输出格式
# x11() # 定制图形环境
# par(pch = "+") # 定制数据点的标示符
# source(file.path(Sys.getenv("HOME"), "R", "mystuff.R")) # 个人编写的函数
# library(MASS) # 导入包
# }
# 类似的是,如果定义了函数.Last(),它(常常)会在对话结束时执行。
Hello World!
- 完成你的第一个R语言数据分析,本章的示例代码多借鉴于 R in action
- 输入以下代码并运行
#这是一行注释
if(FALSE){
这是
多行注释
}
age <- c(1,3,5,2,11)
weight <- c(4.4,5.3,7.2,5.2,8.5)
mean(weight)
sd(weight)
cor(age,weight)
plot(age,weight)
控制台和多功能台会输入以下内容
> mean(weight)
[1] 6.12
> sd(weight)
[1] 1.681368
> cor(age,weight)
[1] 0.9561134
和图形
数据类型
向量
a <- c(1,2,3,4,5)
a[c(1)]
# 输出 1
a[c(1,2)]
# 输出 1 2
a[c(2:4)]
# 输出 2 3 4
矩阵
- 矩阵基础
rnames <- c('r1','r2')
cnames <- c('c1','c2')
cells <- c(11,12,21,22)
mymatrix <- matrix(cells,nrow=2,ncol=2,byrow=TRUE,
dimnames=list(rnames,cnames))
mymatrix
# 输出
# c1 c2
# r1 11 12
# r2 21 22
# byrow默认为FALSE
# 不指定rname和cname则为数字索引
mymatrix[2,]
# 输出
# c1 c2
# 21 22
mymatrix[,2]
# 输出
# r1 r2
# 12 22
mymatrix[2,2]
# 输出
# 22
mymatrix[2,c(1,2)]
# 输出
# c1 c2
# 21 22
- 矩阵工具
- 外积(矩阵/数组)
a <- matrix(c(1,2,3,4),nrow=2,ncol=2,byrow=TRUE)
b <- matrix(c(2,4,6,8),nrow=2,ncol=2,byrow=TRUE)
# 外积可以通过特别的操作符%o%实现<