R语言开发基础
简单包含了R语言开发的一部分基础内容,主要还是巩固,希望和大家共同进步。。。。
luyaran
像永远快乐的阳光,追求那至高无上的完美乐园。
展开
-
R语言开发之我想要使用R语言进行开发的原因
R语言是常用于统计计算,数据分析和科学研究的编程语言和环境,它是由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建的,目前由R Development Core Team开发维护,并且它还是统计学家,数据分析师,研究人员和营销人员最常使用的编程语言之一,这些人主要使用R语言来检索,清理,分析,可视化和呈现数据。由于R语言具有表现力的语法和易于使用的界面,近年来越来越...原创 2018-09-12 10:37:28 · 1550 阅读 · 1 评论 -
R语言开发之Windows7基础环境搭建
我们可以从R-3.4.1 for Windows(32/64位)下载Windows的Windows安装程序版本,并将其保存在本地目录中。打开界面如下:点击红色框框中的内容进入如下界面:再点击红色框框中的内容进入如下界面:完事点击上图中的红色框框进行下载,下载完事之后是个exe文件,需要我们双击运行,双击之后,为如下界面:一直点击下一步,直到这里:选择你的...原创 2018-09-12 14:50:44 · 1667 阅读 · 0 评论 -
R语言开发之输出第一个字符串 HELLO WORLD
学习一个新编程语言的惯例是什么,当然是输出一个万能字符串,那就是‘hello world’。咱们可以在R命令提示符下编程,也可以使用R脚本文件编写程序,先来看R命令提示符下的输出: 之后咱们就来看R脚本文件怎么来写,首先是在一个地方新建一个文件夹,然后命名一个.R的文件,如下:之后我们来看如何运行它:如下,就算是运行完成了。。。好啦,本次记录就到这里了。如果感觉不错...原创 2018-09-13 14:20:54 · 4632 阅读 · 0 评论 -
R语言开发之数据类型之向量&列表&矩阵
我们在使用任何编程语言进行编程时,需要使用各种变量来存储各种信息,这些变量实质上只不过是保存存储值的内存位置。 这也就意味着,当我们创建变量时,可以在内存中保留一些空间用来存储某些值。可能希望存储如字符,宽字符,整数,浮点,双浮点,布尔等各种数据类型的信息,之后根据变量的数据类型,操作系统会分配内存并决定在保留这些内存。但是R语言与其他编程语言(如C语言和Java)相反,它的变量不会被声明为某...原创 2018-09-13 14:45:57 · 2073 阅读 · 0 评论 -
R语言开发之数据类型之数组&因子&数据帧
咱们接着上篇文章来啊,上篇文章最后说道矩阵,但是矩阵只能有两个维度,然而数组可以是任意数量的维数。R语言中数组函数采用一个dim属性,创建所需的维数。 在下面的例子中,我们尝试创建一个有三个元素的数组,每个元素都是3x3个矩阵:运行结果如下:然后因子是使用向量创建的R对象, 它将向量存储在向量中的元素的不同值作为标签,并且标签始终是字符,无论它是输入向量中是数字,还是字符或布尔等,...原创 2018-09-13 15:16:44 · 457 阅读 · 0 评论 -
R语言开发之变量的数据类型&赋值&查找&删除
R语言中的变量提供了程序可以操作的命名存储,这个变量可以存储原子向量,而原子向量组或许多R对象的组合。所以,有效的变量名称应该是由字母,数字和点或下划线字符组成,并且变量名称以字母开头,或者点后面不带数字,我们来看一些变量命名的示例,如下:变量名 合法性 原因 var_name2. 有效 由字母,数字,点和下划线组成 var_name% 无效 含有字...原创 2018-09-13 15:38:34 · 5654 阅读 · 0 评论 -
R语言开发之运算符的一点小记录
运算符是一个符号,它告诉编译器执行特定的数学或逻辑操作,我们来看下R编程中的运算符,共有以下五种:算术运算符 关系运算符 逻辑运算符 赋值运算符 其他运算符我们先来看下R语言支持的算术运算符,示例如下:运行结果如下:再来看下R语言支持的关系运算符,就是将第一个向量的每个元素与第二向量中的相应元素进行比较,比较结果是一个布尔值。 示例如下:运行结果如下:...原创 2018-09-13 16:08:42 · 394 阅读 · 0 评论 -
R语言开发之决策结构(判断语句)了解下
决策结构要求程序员指定要由程序评估计算或测试的一个或多个条件,以及如果条件被确定为真(true),则执行指定的一个或多个语句;可选地,如果条件被确定为假(false)则执行其他语句。我们来看下大多数编程语言中的典型决策结构的一般形式的流程图:R提供以下类型的决策语句:序号 语句 说明 1 if语句 一个if语句由一个布尔表达式,后跟一个或多个语句组成。 ...原创 2018-09-13 16:40:24 · 1533 阅读 · 0 评论 -
R语言开发之循环结构(repeat&while&for)了解下
在编程的时候,当我们需要执行一段代码多次时就可能要执行循环了。一般来说,语句按顺序执行。首先执行函数中的第一个语句,然后执行第二个语句,依此类推。编程语言提供了允许更复杂的执行路径的各种控制结构。同时,循环语句允许我们多次执行语句或语句组,我们来看下大多数编程语言中循环语句的流程图:我们来看下R编程语言提供的几种类的循环来处理循环需求:序号 循环语句 描述 1 r...原创 2018-09-13 16:54:12 · 14815 阅读 · 1 评论 -
R语言开发之循环结构的控制语句(break&next)了解下
循环控制语句用于更改程序正常执行顺序,就是当执行离开范围时,在该范围内创建的所有自动对象都将被销毁。我们来看下R支持的控制语句:序号 控制语句 描述 1 break语句 终止循环语句并将执行转移到循环之后的语句。 2 next语句 next语句模拟R语言中的switch语句的行为。 先来看R编程语言中的break语句,它有以下两种用法:当循环...原创 2018-09-13 17:01:51 · 11316 阅读 · 0 评论 -
R语言开发之函数的使用技巧
一个函数是组合在一起以执行特定任务的一组语句。R具有大量内置函数,当然用户也可以创建自己的功能。在R中,函数是一个对象,所以R解释器能够将控制传递给函数,以将参数传递函数完成操作。该函数又执行其任务并将控制权返回给解释器以及可存储在其他对象中的任何结果。在R语言中,我们使用关键字function来创建一个函数,来看下R函数定义的基本语法:function_name <- funct...原创 2018-09-13 17:29:40 · 9535 阅读 · 0 评论 -
R语言开发之字符串操作基础了解下
在R中的单引号或双引号中写入的任何值都将被视为字符串,并且在R内部将每个字符串存储在双引号内,即使我们是使用单引号创建它们。来看下字符串构造的规则:字符串开头和结尾的引号应为双引号或双引号,他们不能混合。 双引号可以插入到以单引号开始和结尾的字符串中。 单引号可以插入到以双引号开始和结尾的字符串中。 双引号不能插入到以双引号开始和结尾的字符串中。 单引号无法插入到以单引号开始和结尾的字...原创 2018-09-13 17:44:15 · 1477 阅读 · 0 评论 -
R语言开发之向量的创建和访问&操作了解下
向量是最基本的R数据对象,有六种类型的原子向量。它们分别是逻辑,整数,双重,复杂,字符和原始。我们在创建向量的时候,又分为单元素矢量和多元素向量。先来看单元素矢量,它就是即使在R中只写入一个值,它也会被认为是一个长度为1的向量,属于上述向量类型之一,来看下实例: 输出结果为: 再来看多元素向量。我们先来使用冒号运算符与数字数据,看下实例:输出结果为: 我们再...原创 2018-09-14 10:56:07 · 5954 阅读 · 0 评论 -
R语言开发之列表的各种操作记录下
列表是包含不同类型的元素的R对象,如数字,字符串,向量,以及列表中也可包含另一个列表。 列表还可以包含矩阵或函数作为其元素,其中列表是使用list()函数来创建的。我们来看下创建包含字符串,数字,向量和逻辑值的列表的示例: 输出结果为:列表元素可以被赋予名字,并且可以使用这些名称访问列表元素,如下:输出结果为:列表的元素可以通过列表中的元素的索引来访问,并且在命...原创 2018-09-14 11:05:23 · 2547 阅读 · 0 评论 -
R语言开发之矩阵操作了解下
矩阵是其中元素以二维矩形布局排列的R对象,它们包含相同原子类型的元素。 虽然我们可以创建一个仅包含字符或仅包含逻辑值的矩阵,但它们没有太多用处,我们通常使用包含数学元素的矩阵来在数学计算中使用,并且通过使用matrix()函数来创建矩阵。基本语法如下:matrix(data, nrow, ncol, byrow, dimnames)参数描述如下:data - 是将要转为矩阵元素的输入...原创 2018-09-14 11:33:21 · 1151 阅读 · 0 评论 -
R语言开发之数组操作了解下
数组是可以在二维及以上存储数据的R数据对象, 例如 - 如果创建一个维数组(2,3,4),那么它将创建4个矩形矩阵,每个矩阵具有2行和3列并且数组只能存储数据类型。我们可通过使用array()函数来创建数组,它将向量作为输入,并使用dim参数中的值来创建数组。我们接下来就来尝试创建两个3x3矩阵的数组,每个矩阵具有3行和3列,如下:输出结果为:我们还可以使用dimnames参数...原创 2018-09-14 13:19:37 · 2102 阅读 · 0 评论 -
R语言开发之因子操作了解下
因子是用于对数据进行分类并将其存储为级别的数据对象,它们可以存储字符串和整数,并且在具有有限数量的唯一值的列中很有用, 像“男”,“女”,“真”,“假”等。一种在统计建模的数据分析中很有用,我们可以通过factor()函数使用向量作为输入来创建因子,看下实例:输出结果为:我们在使用一列文本数据创建数据帧时,R将文本列视为分类数据并在其上创建因子,如下: 输出结果为:...原创 2018-09-14 13:27:16 · 928 阅读 · 0 评论 -
R语言开发之数据帧操作了解下
数据帧是一个表或二维类似数组的结构,其中每列包含一个变量的值,每行包含来自每一列的一组值,我们来看下它的一些特征:列名称应该不为空。 行名称应该是唯一的。 存储在数据帧中的数据可以是数字,因子或字符类型。 每列应包含相同数量的数据项。我们来尝试创建,如下: 输出结果为:我们可以通过使用str()函数可以查看数据帧的结构,如下:输出结果为:数据的统计摘要和...原创 2018-09-14 13:40:45 · 1996 阅读 · 1 评论 -
R语言开发之包是个什么鬼???
R包是R函数,编码和样本数据的集合, 它们存储在R环境中的名为“library”的目录下。 默认情况下,R在安装过程中安装一组软件包。当需要某些特定的目的时,也可根据需要添加更多的包。 当我们启动R控制台时,默认情况下只有默认软件包可用。 已经安装的其他软件包必须明确加载才能被要使用的R程序使用。R语言中提供的所有软件包均列在R软件包中。我们先来尝试获取包含R包的库位置:完事看下l...原创 2018-09-14 15:57:47 · 5131 阅读 · 1 评论 -
R语言开发之这个数据重塑就厉害了
R中的数据重整是关于将数据组织成行和列的方式。R中的大多数时间数据处理是通过将输入数据作为数据帧来完成的。我们很容易从数据帧的行和列中提取数据,但是有些情况下,我们需要的格式与收到的格式不同。R具有许多函数,用于在数据帧中拆分,合并和更改行到列,反之亦然。我们可以使用cbind()函数连接多个向量来创建数据帧,也可以使用rbind()函数合并两个数据帧,如下:输出结果为:...原创 2018-09-18 17:32:34 · 341 阅读 · 1 评论 -
R语言开发之CSV文件的读写操作了解下
在R中,我们可以从存储在R环境外部的文件读取数据,还可以将数据写入由操作系统存储和访问的文件。这个csv文件应该存在于当前工作目录中,以方便R可以读取它, 当然,也可以设置自己的目录,并从那里读取文件。我们可以使用getwd()函数来检查R工作区指向哪个目录,并且使用setwd()函数设置新的工作目录,如下:输出结果如下:csv文件是一个文本文件,其中列中的值用逗号分隔,我们可...原创 2018-09-17 13:26:54 · 22013 阅读 · 0 评论 -
R语言开发之EXCEL文件的读写操作了解下
Microsoft Excel是使用最广泛的电子表格程序,它是以.xls或.xlsx格式存储数据。 R可以使用某些excel特定的包直接读取这些文件的内容,一些常用的软件包有 - XLConnect,xlsx,gdata等。我们这次要尝试使用xlsx软件包来读写excel文件,至于具体安装的问题咱们就不多说了啊,后期会写一篇文章单独说说这个事情。先来看表单内容:来看实例:输...原创 2018-09-18 17:49:54 · 2591 阅读 · 0 评论 -
R语言开发之输出饼状图
R编程语言中有许多库用来创建图表,其中饼状图是以不同颜色的圆的切片表示的值,这些切片被标记,并且每个切片对应的数字也在图表中表示。在R中,我们将正数作为向量输入的pie()函数创建饼状图,附加参数用于控制标签,颜色,标题等,看下语法:pie(x, labels, radius, main, col, clockwise)参数描述如下:x - 是包含饼图中使用的数值的向量。 labe...原创 2018-09-17 14:59:14 · 3783 阅读 · 0 评论 -
R语言开发之输出条形图
条形图表示矩形条中的数据,其长度与变量的值成比例,R使用barplot()函数来创建条形图。R可以在条形图中绘制垂直和水平条,并且,在条形图中,每个条可以被赋予不同的颜色,语法如下:barplot(H, xlab, ylab, main, names.arg, col)参数描述如下:H - 是包含条形图中使用的数值的向量或矩阵。 xlab - 是x轴的标签。 ylab - 是y轴...原创 2018-09-17 15:06:54 · 1846 阅读 · 0 评论 -
R语言开发之输出盒形图
盒形图是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图,比较数据集中的数据分布也很有用。在R中的盒形图通过使用boxplot()函数来创建,来看下语法:boxplot(x, data, notch, varwidth, names, main)参数描述如下:x - 是向量或...原创 2018-09-17 15:27:53 · 2687 阅读 · 1 评论 -
R语言开发之输出直方图
直方图表示一个变量范围内的值的频率。直方图类似于条形,但区别在于将值分组为连续范围。直方图中的每个栏表示该范围中存在的值的数量的高度。在R中使用hist()函数创建直方图。 该函数将一个向量作为输入,并使用一些更多的参数绘制直方图,来看下语法:hist(v,main,xlab,xlim,ylim,breaks,col,border)描述如下:v - 是包含直方图中使用数值的向量。 ...原创 2018-09-17 15:33:24 · 2961 阅读 · 0 评论 -
R语言开发之输出折线图
线形图是通过在多个点之间绘制线段来连接一系列点所形成的图形,这些点按其坐标(通常是x坐标)的值排序,并且它通常用于识别数据趋势。在R中的通过使用plot()函数来创建线形图,语法如下:plot(v,type,col,xlab,ylab)参数描述如下:v - 是包含数值的向量。 type - 取值“p”表示仅绘制点,“l”表示仅绘制线条,“o”表示仅绘制点和线。 xlab - 是x...原创 2018-09-17 15:39:21 · 3224 阅读 · 0 评论 -
R语言开发之输出散点图
散点图显示了在笛卡尔平面绘制的多个点。每个点代表两个变量的值。在水平轴上选择一个变量,在垂直轴中选择另一个变量。在R中简单散点图使用plot()函数来创建,语法如下:plot(x, y, main, xlab, ylab, xlim, ylim, axes)参数描述如下:x - 是数据集,其值是水平坐标。 y - 是数据集,其值是垂直坐标。 main - 是图表的标题。 xla...原创 2018-09-17 15:46:19 · 2225 阅读 · 0 评论 -
R语言开发之平均值,中位数和众数了解下
R中的统计分析通过使用许多内置函数来执行的,这些函数大部分是R基础包的一部分,并且它们将R向量与参数一起作为输入,并在执行计算后给出结果。先来看如何求平均值。平均值是通过取数值的总和并除以数据序列中的值的数量来计算,函数mean()用于在R中计算平均值,语法如下:mean(x, trim = 0, na.rm = FALSE, ...)参数描述如下:x - 是输入向量。 t...原创 2018-09-17 15:59:46 · 20644 阅读 · 0 评论 -
R语言开发之二进制文件读写操作
二进制文件是一个文件,其中包含仅以位和字节形式存储的信息(0和1),它们是不可读的,因为其中的字节转换为包含许多其他不可打印字符的字符和符号,随便我们尝试使用任何文本编辑器读取二进制文件将显示为类似Ø和ð这样的字符。但是二进制文件必须由特定程序读取才能使用。例如,Microsoft Word程序的二进制文件只能通过Word程序读取到人类可读的形式。这表明,除了人类可读的文本之外,还有更多的信息...原创 2018-09-19 09:39:39 · 4367 阅读 · 1 评论 -
R语言开发之XML文件处理操作
XML是万维网上使用标准ASCII文本,内部网和其他地方共享文件格式和数据的文件格式,它代表可扩展标记语言(XML)。 与HTML类似,它包含标记标签,但与标记标签描述页面结构的HTML不同,标记标签描述了文件中包含的数据的含义。在R中,我们可以使用“XML”包读取R中的xml文件。我们接下来通过将以下数据复制到文本编辑器(如记事本)中来创建XMl文件,并且使用.xml扩展名保存文件,并将文件...原创 2018-09-19 09:46:39 · 5514 阅读 · 0 评论 -
R语言开发之JSON文件处理操作
JSON文件以可读取的格式将数据存储为文本,它是一种JavaScript对象表示法,在R中可以使用rjson包读取JSON文件。我们通过将以下数据复制到文本编辑器(如记事本)中创建一个JSON文件,并且使用.json扩展名保存文件,并将文件类型选为所有文件(*.*),内容如下:{ "ID":["1","2","3","4","5","6","原创 2018-09-19 09:54:48 · 4773 阅读 · 2 评论 -
R语言开发之MySQL数据处理操作
关系数据库系统中的数据是以规范化格式存储的,所以,为了进行统计计算,我们需要非常高级和复杂的SQL查询。但是R可以很容易地连接到许多关系数据库,如:MySQL,Oracle,Sql Server等,并将它们作为数据帧提取。 当从数据库中读取数据到R环境中可用以后,它就成为一个正常的R数据集,可以使用所有强大的软件包和函数进行操作或分析。在R中有一个名为RMySQL的内置包,它提供与MySql数...原创 2018-09-19 14:19:02 · 1293 阅读 · 0 评论 -
R语言开发之如何简单方便的加载R包(win7版)
说实话,这个R包这个事情,困扰了咱不是一天两天了,用哪个install什么的函数安装的包,一直报错。废话不多说,咱们直接来看最简单的方案。首先,就是下载这个包,在下面这个地址:https://cran.r-project.org/web/packages/包的名称/index.html你只需要把上面地址中的汉字替换成你需要安装的包的名称之后,就可以打开页面进行下载了,打开之后的页...原创 2018-09-19 14:27:40 · 6459 阅读 · 2 评论 -
R语言开发之线性回归了解下
回归分析是一个广泛使用的统计工具,用于建立两个变量之间的关系模型,这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值来自预测变量。在线性回归中,这两个变量通过一个等式相关联,其中这两个变量的指数(幂)是1,数学上,当绘制为图形时,线性关系表示直线,并且任何变量的指数不等于1的非线性关系产生曲线。来看下数学上定义的方程式:y = ax + b参数描述如下:y -...原创 2018-09-19 14:39:10 · 407 阅读 · 0 评论 -
R语言开发之多元(多重)回归了解下
多元(多重)回归是线性回归扩展到两个以上变量之间的关系。在简单的线性关系中,我们有一个预测因子和一个响应变量,但在多元回归中,可以有多个预测变量和一个响应变量,来看下多元(多重)回归的数学方程:y = a + b1x1 + b2x2 +...bnxn参数描述如下:y - 是响应变量。 a,b1,b2 … bn - 是系数。 x1,x2,… xn - 是预测变量。我们可以使用R中...原创 2018-09-19 14:47:03 · 2541 阅读 · 0 评论 -
R语言开发之逻辑回归应用了解下
逻辑回归是一种回归模型,其响应变量(因变量)具有分类值,如True/False或0/1,它实际上是根据与预测变量相关的数学方程,来衡量二进制响应的概率作为响应变量的值,它的数学方程一般为:y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...))参数描述如下:y - 是响应变量。 x - 是预测变量。 a 和 b 是数字常数的系数。我们通常使用glm()函数来创建逻...原创 2018-09-19 14:53:53 · 474 阅读 · 0 评论 -
R语言开发之正态分布了解下
在随机收集来自独立来源的数据中,通常观察到数据的分布是正常的,这意味着,在绘制水平轴上的变量的值和垂直轴中的值的计数时,我们得到一个钟形曲线,曲线的中心代表数据集的平均值。 如果在图中,百分之五十的值位于平均值的左侧,另外五十分之一位于图的右侧,我们就可以统称为正态分布。在R中有四个内置函数来生成正态分布,如下:dnorm(x, mean, sd)pnorm(x, mean, sd)qn...原创 2018-09-19 15:02:10 · 6890 阅读 · 1 评论 -
R语言开发之二项分布了解下
二项分布模型用来处理在一系列实验中只发现两个可能结果的事件的成功概率,例如,掷硬币总是两种结果:正面或反面。我们可以使用二项式分布估算在重复抛掷硬币10次时正好准确地找到3次是正面的概率。在R中具有四个内置函数来生成二项分布,如下:dbinom(x, size, prob)pbinom(x, size, prob)qbinom(p, size, prob)rbinom(n, size,...原创 2018-09-19 15:07:56 · 1277 阅读 · 0 评论 -
R语言开发之泊松回归了解下
泊松回归涉及回归模型,其响应变量是计数形式而不是分数数字。举个栗子,计算出生人数或一个足球比赛系列中的胜率数,响应变量的值也遵循泊松分布,一般情况下它的数学方程式如下:log(y) = a + b1x1 + b2x2 + bnxn.....参数描述如下:y - 是响应变量。 a 和 b 是数字系数。 x - 是预测变量。在R中,用于创建泊松回归模型的函数是glm()函数,语法如...原创 2018-09-20 10:26:32 · 2808 阅读 · 0 评论