1.1 R
R是一个种解释性语言(时候也称脚本语言),作为一种高级语言,R旨在更为快捷更为强大的为你分析数据,而你无需知道代码在底层是如何运行的。
R VS. Excel
EXCEL作为微软推出的一款强大的办公软件,如果说真的精通了(精通VBA,熟练掌握Power Query,Power Pivot,Power Map,Power View,Power BI ),其实我觉得用来做数据分析也绰绰有余力,但是我所说的上述EXCEL的种种扩展包,你都可以在R中轻松实现,而且R可以做的更多。这也使得越来越多的从事数据相关的工作者会选择R或者Python,而不仅仅是Excel。
1.2 安装R
访问网站http://www.r-project.org,阅读Getting Started,点击download R链接选择China的镜像后就可以下载了,R支持各类主流的操作系统,Linux,Macos,Windows
1.3 选择一个IDE
这里三种较为主流的集成开发环境(IDE),如果你不是一定要某款编译器不可。
1.3.1 RStudio
RStudio IDE只能用于R开发。但是不影响它的使用量,因为它的编程器比Emass或Eclipse简单,但是基本够用且更易上手,所以非常适合初学者,而且它还提供了发布代码的工具和通过远程浏览器远程执行的能力,虽然这两个功能我还没用用过2333..
下载地址:http://www.rstudio.org
1.3.2 Revolution-R
R语言的大数据版本,后来被微软收购,对于新手来说,这意味着你之前听说的R语言支持大数据之类的福利跟你没有关系了,但是微软还是提供了社区版本可以免费使用
下载地址:http://www.revolutionanalytics.com/products/revolution-r.php
1.3.3 Emaacs+ESS
最为强大的编译器,也是学习起来难度最大的,毕竟没有付出没有回报。由于本人水平有限,也没有接触过这类纯文本的编译器,这里只提供一个下载地址,供感兴趣的下载
Emacs的GNU版本下载地址:http://www.gnu.org/software/emacs/
Emacs的流行分支XEmacs下载地址:http://www.xemacs.org/
ESS的下载地址:http://ess.r-project.org/
1.4 第一个程序
其实满纠结的,因为R语言我也是在一个学习阶段,显然写一个"hello,world"显然有些不合时宜,而且在R中这样显然的工作也没有任何意义。昨天是1024,那么我们算一下爱的"期望"吧
x <- c( 73,76,79,86,85 ) mean(x) [1] 79.8
1.5 如何从R中获得帮助
世界没有了帮助该怎么办!帮助可以帮我更好的自学R,如果说R相关的所帮助都看过了,觉得应该出本关于R语言使用的专业书籍了。那么如果在R中或者帮助呢?
你可以使用函数help或者help.search来完成获取帮助和搜索帮助,或者使用?和??,但是在使用?或者??需注意对于特殊字符,关键字和多个字词的搜索需加上单引或者双引号。
help( “mean” ) help( “+” ) help( “if” ) help.search( “plotting” ) help.search( “regression model” )
PS:书中有提到正则表达式,这个时候会另外写一个随笔。感兴趣的话可以登录http://www.regular-expresions.info/quickstart.html
1.6 一些必要的软件
如果你第一次安装R,建议你安装这些软件,可以帮助你更好的使用R
install.packages( “installr” ) #下载并安装installr包 library( installr ) #转载installr包 install.RStudio() #下载并安装RStudio IDE install.Rtools() #你需要Rtools来构建自己的包 install.git() #git提供了代码的版本控制功能
PS:install.packages( “installr” ) 括号内的空格如果删除代码也是可以正常运行的,空格是因为书写习惯,防止有人黑在R中输入a < -b会感觉统计学家满满的恶意