R的常用命令
R的命令非常多,但是有一些命令是非常常用的,在这里我做一个汇总,便于大家使用。(Tips:关于下载和安装R的package以及工作目录的获得与设置命令在第二篇已经聊过,此时就不再赘述了,详见从零开始学R(二)——R语言基础)
1、帮助命令
R是一款很优秀的统计软件,这样评价的一个重要原因是,使用者可以通过R自身来学习R。例如,如果我们想要了解数据框转换命令as.data.frame()
,我们可以输入如下代码
help("as.data.frame")
?"as.data.frame"
在RStudio中,我们可以在右下角(前提是没有调整过RStudio的布局)的界面得到这个函数的具体信息,包括它的描述(Description),使用方法(Usage),语句(Arguments),细节(Details)以及参考文献(References)等。有时候对于有些命令,我们可能阅读上述信息之后还是不熟悉,此时我们可以使用example()
函数来让R为我们做出示范,这就是为什么我们能够利用R进行自学的原因。
对于部分函数来说,帮助命令中的引号可以省略,但是由于一些函数中存在特殊字符,此时就必须使用引号。比如?>
的运算结果就会出错,而?">"
则会显示出>函数的帮助页面。
如果我们不太清楚我们想要找的函数的名字是什么,但是我们知道这个函数是用来做什么的,我们可以采用模糊搜索。比如我们想了解,什么函数能够帮助我们生成一个多元正态分布的随机变量函数,我们就可以使用如下命令
help.search("multivariate normal")
??"multivariate normal"
有时候我们可能想了解一个package的用法,虽然我在这里推荐小伙伴们直接去CRAN寻找相关package的介绍文件,但是我们也可以在R中直接去搜索,了解基本信息
help(package = "package.name")
2、表格型文件的导入与导出
使用R的数据分析师或者数据科学家通常是对现实世界的某些数据进行分析,因此,在完成数据收集后,我们需要将所收集到的数据导入的R中进行整理与分析。我们在这里重点介绍一些常用的文件导入方式。
CSV文件
CSV(Comma-Separated Values)文件一种表格存储类型的文件,数据之间采用逗号(或其他字符)进行分隔。R的通用package(R自带)中有读取csv文件的命令
data <- read.csv("working directory/name.csv")
data <- read.csv2("working directory/name.csv")
第一个命令的分隔符默认为逗号",",第二个命令的分隔符默认为分号";"。
此外,我们还可以用另一个命令来读取csv文件
data <- read.table("working directory/name.csv"