初识R语言
上一节简单介绍了R语言的情况,这一节我想聊一聊R的基本情况。
R的运行需要占据一定的内存(这里说的运行R一般都指运行RStudio,除非特别指出),所以推荐大家使用运行内存8G以上的电脑(我曾用4G的电脑运行R,一份35MB的数据读入时间接近5分钟)。
R需要进行相应的计算,因此对于不同的数理统计模型来说,由于计算量大小不同,代码运行时间长短也不一致。有些复杂模型运行时间较长是很正常的现象哦。
那些与我们打交道的R命令
R pacakge的下载与调用
首先,R通过各种程序包(package)的内置函数来完成相应的统计要求,在下载R的同时,一些基本的包(base)也同时下载到我们的目录中。当然,很多程序包需要我们手动下载,因此我们需要运行这样的代码来下载程序包
install.packages()
#例如
install.packages("tidyverse")
程序包下载需要加双引号,而且也要区分大小写,不过RStudio有时候会帮助你识别,询问你是否下载的是某个包。以我的经验来看,有时候RStudio的下载会运行很慢,看起来像是卡机,这时候你可以停止这一程序,换R的交互界面,选择合适的镜像(mirror)来进行下载,速度会快很多,而且结果是一样的。
下载完成后,如果你想要运行某个程序包的代码,可以用下面两种方式
#方式一
library(tidyverse)
#方式二
tidyverse::filter()
方式一是在数据库中调用相应的程序包,调用一次以后,在关闭R之前都可以使用这个程序包中的所有函数。但是下一次打开R的时候还需要再重新调用一次。
方式二是如果你仅仅想用某个包里面的某个函数,那么你可以不用library()函数进行调用,用双冒号来调用也是可以的。但是如果想使用这个包中的其他函数,就还需要再次调用。
另外,你们看到代码里面有一个#,这个符号的意思是某一行#以后的所有代码全部忽略。所以往往这个符号可以用来作为注释符号,在代码分割与解释的时候可以使用,可以让你的代码看起来更具有可读性,更有逻辑