R笔记

R是用于统计计算和绘图函数语言。R语言主要包括两个概念:对象和函数。

基本数据结构

R中的数据结构主要有5中,如下图所示:

这里写图片描述
所有对象都有模式(mode)和长度属性向量,分别指示对象中元素的类型和元素的个数。
变量可以分为名义型、有序型和连续型,因子是指名义型(如水果类型:苹果、葡萄等)和有序型(如水果质量等级:极品、优质、普通)。在R中因子类型决定了数据的分析和进行视觉展示的方式。

向量

矩阵和数组

矩阵是二维数组

矩阵

增加行或列

rbind(mymatrix[1:2,], 0, mymatrix[3:4,]) 插入一行0
cbind(mymatrix[,1:3], 1, mymatrix[,4:5]) 插入一列1

删除行或列

mymatrix[-1,]
mymatrix[,-1]

判断对象类型

is.vector(test)
is.matrix(test)
is.data.frame(test)

对象类型转换

newDataFram<-data.frame(aMatrix)

判断对象元素类型

mode(test)#dataframe的元素类型多是List

获取名字

names(aDataFrameOrVector)
colnames(aMatrix)
rownames(aMatrix)

列表

列表是以其他对象为成分的有序的集合。列表中的成分和向量中的元素不同之处在于:成分不一定是同一种类型,而且成分总是编号的并且有一个名称属性。
可以通过unlist()将列表转换为向量。

数据框

因子

无序因子

fac<-c('apple','grape')
fac<-factor(fac)

有序因子

fac<-c('A','B','C')
fac<-factor(fac,ordered=TURE)

常用函数

分为数值处理函数和字符处理函数。
数值处理函数:数学函数(如abs(x))、统计函数(如mean(x),sd(x),cov(x,y),sample(1:20,size=6))、概率函数(如dnom(),runif(10000))
字符处理函数:如substr()
其他:seq()

getwd()#查看当前工作目录
setwd("D:\\path\\to\\Rwork")#设置工作目录

工具包

数据重塑reshape

参考文献

1.数据挖掘与R语言
2.R语言实战

### R语言 ggplot2 教程 笔记 #### 使用 `ggplot` 创建基础图形 创建一个基本的 `ggplot` 图形涉及指定数据源以及美学映射。例如,在钻石数据集中,可以基于克拉重量 (`carat`) 和价格 (`price`) 绘制散点图,并按切割质量 (`cut`) 上色: ```r library(ggplot2) gg <- ggplot(diamonds, aes(x = carat, y = price, color = cut)) + geom_point() + labs(title = "Scatterplot", x = "Carat", y = "Price") print(gg) ``` 此代码片段展示了如何通过设置坐标轴标签和图表标题来增强可视化效果[^1]。 #### 利用 `geom_point()` 函数绘制散点图 为了更具体地说明散点图的功能,下面的例子使用了汽车燃油效率的数据集 (`mpg`) 来比较城市里程 (`cty`) 和高速公路里程 (`hwy`) 的关系: ```r ggplot(data = mpg, mapping = aes(x = cty, y = hwy)) + geom_point() ``` 这段脚本利用 `geom_point()` 函数实现了两个连续变量之间的简单关联分析[^2]。 #### 应用 `geom_line()` 进行折线图绘制 当处理时间序列或其他有序数值时,可以选择 `geom_line()` 方法连接各个观测点形成趋势线。这里给出了一种方式用来表示中国历年某项指标的变化情况: ```r ggplot(a, aes(x = year, y = CHN)) + geom_line() ``` 上述命令中的 `a` 是指代含有年份与对应值的数据框名称;而 `x=` 和 `y=` 参数则分别定义横纵坐标的取值依据[^3]。 #### 结合 `facet_wrap()` 实现分面布局 对于多类别的数据分析而言,`facet_wrap()` 提供了一个便捷途径——即按照某个因子分割视窗并独立呈现各子组内的分布特征。如下所示为一种典型的应用场景: ```r ggplot(data, aes(x = x_variable, y = y_variable)) + geom_point() + facet_wrap(~ facet_variable, nrow = number_of_rows, ncol = number_of_columns) ``` 这里的 `data`, `x_variable`, `y_variable`, 及 `facet_variable` 需要替换为实际使用的数据对象及其属性列名;同时还可以自定义行列数目以优化显示格式[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值