2.1R的简单 介绍
一、R是一种自由、免费、开源的解释型编程语言,具有强大的数据分析工具和图形工具,支持多种设备上的分析和展示。
S语言无须关心内存分配与数据结构细节,具有良好的可移植性与可扩展性。
2.2R的初步体验
一、R的下载与安装:
https://blog.youkuaiyun.com/m0_47397401/article/details/106070026
二、RStudio下载与安装:
https://blog.youkuaiyun.com/m0_47397401/article/details/106070609
2.3基本语法
R语言允许直接使用变量,不需要预定义数据类型
一、注释语句
以字符#开头的语句称为注释语句。注释内容占多行时,每行前面都要加上#。在RStudio中,可以使用快捷键Ctrl+Shift+C注释一块程序,也可以使用Ctrl+Shift+C去除注释。
二、表达式语句
1、在R中,所有的变量、数据及函数都以对象的形式保存在内存中。对象的名字必须以字母开头,中间可以包含点(.)及下划线(_)。
2、赋值功能:=、->、-<
3、加、减、乘、除、乘方、取模、整数除法:+,-,*,/,^,%%,%/%
4、+号也可以用作连字符
5、大于、小于、大于等于、小于等于、等于、不等于:>,<,>=,<=,==,!=
6、字符型数据可以用单引号或者双引号表示
7、与、或、非:&,|,!
8、a %in% b,可判断a是否在b中间
三、函数调用语句
函数调用语句的一般形式为:
函数名(实际参数1,实际参数2,……)
四、控制语句
五、函数
ls():列出内存中的所有对象名
help():获取关于函数的进一步介绍信息
rm()/remove():删除内存中的所有对象
paste():将多个字符型对象串起来
paste0():sep为空字符
cat():以用户自定义的形式输出结果
plot():作图画出y相对于x的变化情况
c():把若干个参数组合成一个向量或者列表,函数的返回值即为组合的结果
六、自定义函数:
R语言允许如下形式的自定义函数:
采用超级赋值**<<**可以使r从局部变量变为全局变量
2.4常用数据结构
2.4.1向量
一、向量和基础数据类型
R中的基本类型是向量,而不是标量
根据存储元素类型的不同,向量可以分为如下几类:
整数型、数值型、字符型、逻辑型、复数型
assign函数可替换为<-,可以使用**class()**函数来检查生成这4个向量的类型
在R中,逻辑值的表示为TRUE和FLASE,也可以简写为T和F。
seq():生成序列
rep():生成一个所有元素都相同的向量
或者使用如下函数,效果完全相同
常用的类型转换函数有:
在R中,无论数据类型如何,缺省值都用NA表示,进行任何操作所得的结果都是NA。对于NA值,一般使用is.na()来处理。
二、向量的运算
2.4.2因子
在R中,因子是用来表示分类变量的一种有效方法,所谓分类变量就是取值来自一个集合的变量
因子数据:如果将每个元素都存储为字符型数据,则会占用比较多的存储空间。为节省存储空间,可以用正整数的形式保存每个元素,并保存正整数到各个取值之间的映射关系。这样得到的数据就是因子数据,而所有不同的取值称为水平
将gender转化为因子数据
levels():获取所有水平值
2.4.3矩阵
一、矩阵的定义
array():matrix():获得矩阵
colnames(M):获取和修改M的列名
rownames(M):获取和修改M的行名
二、矩阵的运算
1、基本运算
矩阵乘积:A %*% B
输出:
solve():求解逆矩阵
2.4.4数据框
一、数据框的定义
数据框是R语言中最接近SAS和SPSSS数据集的数据结构,它在形式上类似于矩阵,但允许各列的数据类型不同,可以很方便地表示实际中的各种数据。
创建数据框的方法:
1、通过读取文件的方式创建数据框
2、手工创建数据框
二、 数据框的操作
rbind(dfa,dfb):按dfa中的列顺序依次捆绑dfa和dfb的行,生成一个新的数据框
cbind(dfa,dfb):按dfa中的行顺序依次捆绑dfa和dfb的行,生成一个新的数据框
expand.grid():将参数的不同组合保存在一个数据框中
2.4.5列表
R的列表是一个由对象的有序集合构成的对象。列表中包含的对象又称为它的分量。列表中的分量可以为任意类型,包括列表。