
技术层-R语言
文章平均质量分 74
小丁丁_ddxdd
这个作者很懒,什么都没留下…
展开
-
R语言-循环与条件
循环for (n in x) {expr}R中最基本的是for循环,其中n为循环变量,x通常是一个序列。n在每次循环时从x中顺序取值,代入到后面的expr语句中进行运算。下面的例子即是以for循环计算30个Fibonacci数。x for (i in 3:30) { x }while (condition) {expr}当不能确定循环次数时,我们需要用转载 2016-06-03 00:01:53 · 29261 阅读 · 0 评论 -
R语言-时间序列函数整理
【包】library(zoo) #时间格式预处理library(xts) #同上library(timeSeires) #同上library(urca) #进行单位根检验library(tseries) #arma模型library(fUnitRoots) #进行单位根检验转载 2016-06-18 14:38:58 · 12041 阅读 · 0 评论 -
R语言-日期与时间格式
R语言是开源的,同时可以运行在各种平台上(Linux、Windows、MacOS等)。R的许多软件包是由R语言、 LaTeX、Java及最常用C语言和Fortran撰写。本篇为大家介绍的是R语言日期格式数据。#日期型数据在R中自带的日期形式为:as.Date();以数值形式存储;对于规则的格式,则不需要用format指定格式;如果输入的格式不规则,可以通过format指定的格式转载 2016-06-19 00:21:44 · 15505 阅读 · 0 评论 -
R语言-Rwordseg中文分词包安装步骤
1.在R中先装rJava包2.没有装JDK的要到这里去下载http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.htmlR是64位的就要下64位的JDK,下载完成后配置环境。3.如果不想在电脑里配置环境,则需要每次启动R之后,在R中运行Sys.setenv(JAVA_HOME='转载 2016-05-14 15:03:51 · 8954 阅读 · 0 评论 -
R语言-向量化操作(apply、tapply、lapply、sapply、mapply、table等)
apply函数(对一个数组按行或者按列进行计算): 使用格式为:apply(X, MARGIN, FUN, ...)其中X为一个数组;MARGIN为一个向量(表示要将函数FUN应用到X的行还是列),若为1表示取行,为2表示取列,为c(1,2)表示行、列都计算。示例代码:> ma > ma [,1] [,2] [,3] [,4][1,]转载 2016-06-02 23:47:22 · 53614 阅读 · 0 评论 -
R语言-数组与数据框操作
1、 数组基本的操作:1) 、查看数组---直接调用数组名回车;2) 、按照下标获取数组元素---调用数组名+方括号+元素下标;3)、查看数组长度(length());4)、查看数组元素类型(mode(); ps:语言只支持数组元素单一类型,及所有元素要么都是字符,要么都是数值)5)、对数组的操作还包括多个数组的包括,可以将两个数组组合成一个矩阵(R语言称转载 2016-05-24 21:57:34 · 17129 阅读 · 0 评论 -
R语言-读取、输出及操作
----------读取txt格式数据a----------读取xlsx(excel2007)的文件library(xlsx)a--------与数据库连接取数library(RMySQL)connectMySQL<-function(mysql,dbname,user,password,host){ drv<-dbDriver(mysql)转载 2016-05-31 23:11:39 · 11287 阅读 · 0 评论 -
R语言-学习笔记
参考:W.N. Venables, D.M. Smith and the R DCT: Introduction to R -- Notes on R: A Programming Environment for Data Analysis and Graphics, 2003. http://bayes.math.montana.edu/Rweb/Rnotes/R.html前言:关于转载 2016-05-19 00:05:18 · 1185 阅读 · 0 评论 -
R语言-ggplot2柱状堆叠图
###导入数据load("D:\\R\\futures_user_2.dat")####提取需要画图的数据a=futures_user_2[,c(1,2,5)]####对部分错误的数据进行修改a$province[which(a$province=="广西桂林")]######去除空置和nullb=a[-which(is.na(a$province)),原创 2016-06-21 23:13:59 · 39044 阅读 · 0 评论 -
R语言-ggplot基础性操作
---------画散点图p aes(x =持仓品种数, y = 年化收益率)) ###选取字段+geom_point(aes(color = factor(年化收益率分类)),size=2)###修改颜色,按照类来区分+labs(title="年化收益率与参与品种数量") ###图表标题+theme(plot.title= element_text(原创 2016-06-21 23:24:49 · 1253 阅读 · 0 评论 -
shiny--quantmod搭建量化平台
来源:https://segmentfault.com/a/1190000004543727?_ea=657979library(shiny)# 为应用程序定义UI,演示R包quantmod作图功能ui=shinyUI( navbarPage("R quantmod Demonstration for Data Products Class", inverse=FALSE,转载 2016-09-17 12:31:57 · 1729 阅读 · 0 评论 -
shiny--练习记录
触发setwd('D://shiny_test//07')library(rsconnect)source('ui.R')source('server.R')shinyApp(ui=ui,server=server)1、library(shiny)ui=shinyUI(pageWithSidebar( headerPanel("hello,world转载 2016-09-17 11:02:21 · 931 阅读 · 0 评论 -
R语言--saprkR基本使用
1.在sparkR的shell中交互式使用sparkR --masterspark://10.130.2.20:7077sparkR --masterlocal[6]#sparkR --master spark://10.130.2.20:7077--driver-memory 3g --executor-memory 2g --total-executor-cores 122.在转载 2016-10-12 09:16:47 · 1223 阅读 · 0 评论 -
R语言-常用命令
---------设定和查看工作目录设定工作目录setwd()如 setwd('D:\\R')注意:用'\\' 代替原本的'\'查看工作目录getwd() 查看包中的函数library(topicmodels)ls("package:包的名称")如:library(topicmodels)ls("package:topicmodels")转载 2016-05-11 00:03:27 · 5972 阅读 · 0 评论 -
R语言:文本(字符串)处理与正则表达式
来源:http://blog.sina.com.cn/s/blog_69ffa1f90101sie9.html处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。R语言处理文本的能力虽然不强,转载 2017-01-14 21:48:31 · 1181 阅读 · 0 评论 -
R语言--数据集合并、数据增减、不等长合并
来源:http://blog.youkuaiyun.com/sinat_26917383/article/details/50676894数据选取与简单操作:which返回一个向量中指定元素的索引which.max返回最大元素的索引which.min返回最小元素的索引sample随机在向转载 2017-02-23 19:44:33 · 14940 阅读 · 0 评论 -
R语言-逻辑操作
R语言的逻辑操作包括以下几项: ! 取非如:> x > !x输出结果为: FALSE如:> x > !x输出结果为:F,F,T,F,T & 和 &&这两者都是逻辑与,操作都是x&y和x&&y如:> x > y > x&&y[1] FALSE> x&y[1] FALSE TRUE FALSE可以看到,&是转载 2016-06-19 00:12:41 · 1360 阅读 · 0 评论 -
R语言-时间序列的创建及时间序列模型
R语言中时间序列的内容主要有:时间序列的创建,ARMA模型的建立与自相关和偏自相关函数。一、 时间序列的创建时间序列的创建函数为:ts().函数的参数列表如下:ts(data = NA, start = 1, end = numeric(),frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class = , na转载 2016-06-18 14:42:59 · 9786 阅读 · 0 评论 -
R语言-用stringr包处理字符串
library(stringr) # 合并字符串fruit res str_c('I want to buy ',res,collapse=' ') # 计算字符串长度str_length(c("i","like","programming R",123,res)) # 按位置取子字符串str_sub(fruit,1,3)# 按位置取子字符串转载 2016-05-31 23:29:27 · 47282 阅读 · 0 评论 -
R语言-时间函数
(1)获取当前日期有两个函数 一个是Sys.Date(),另外一个是Sys.time(),获得向前向后的时间 t<-Sys.time() t [1] "2015-09-22 18:53:56 CST" t是一种长整形的数据自1970-01-01年开始,用unclass()函数得到,时间单位是秒 > unclass(t) [1] 1442919转载 2016-06-07 23:19:27 · 14321 阅读 · 0 评论 -
sparkR介绍及安装
SparkR是AMPLab发布的一个R开发包,为Apache Spark提供了轻量的前端。SparkR提供了Spark中弹性分布式数据集(RDD)的API,用户可以在集群上通过R shell交互性的运行job。例如,我们可以在HDFS上读取或写入文件,也可以使用 lapply 来定义对应每一个RDD元素的运算。[Bash shell] 纯文本查看 复制代码转载 2016-06-02 23:25:42 · 1239 阅读 · 0 评论 -
R语言-创建数据集
2.2.1向量向量是用于存储数值型、字符型火逻辑型数据的一维数组。> a > a[1] 1 2 5 3 6 2 4> a[3][1] 5> a[c(1,2,3)][1] 1 2 5> a[c(1:4)][1] 1 2 5 32.2.2矩阵矩阵式一个二维数组,只是每个元素都拥有相同的模式(数值型,字符型或逻辑型),可通过函数matrix创建矩阵转载 2016-05-21 22:15:36 · 1340 阅读 · 0 评论 -
R语言-merge与subset 的使用
---------------merge与subset 的使用merge函数对数据框的操作,从两个数据框中选择出条件相等的行组合成一个新的数据框> df1=data.frame(name=c("aa","bb","cc"),age=c(20,29,30),sex=c("f","m","f"))> df2=data.frame(name=c("dd","bb","cc"),age=c(40转载 2016-06-07 21:32:28 · 8222 阅读 · 0 评论 -
R语言-设置镜像
local({r r["CRAN"] options(repos=r)})install.packages("stringr")library(arulesSequences)备用镜像:http://mirror.bjtu.edu.cn/cran/http://mirrors.ustc.edu.cn/CRAN/http://mir转载 2016-06-07 23:39:26 · 12906 阅读 · 0 评论 -
R语言-数据处理包 dplyr
数据挖掘,更多的需要花70%以上的时间在数据处理上,所以一些好用的数据处理包会提供很大的方便,也是之前在edx上学Statistic and R for the life Sciences 这门课时候,老师推荐的,感觉很好用的,整理了这个很实用的包的资料。一、安装install.packages("dplyr")二、案例分析与应用1. 数据准备library(Lah转载 2016-06-07 23:52:29 · 1568 阅读 · 0 评论 -
R语言-因子和有序因子
因子(factor)和有序因子(ordered factor)因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,转载 2016-06-08 00:10:31 · 1478 阅读 · 0 评论 -
R语言-入门综合
I. 导论简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。1 为什么要学习R编程大部分情况下解决某些问题还需要依赖一些事实或数据,结合数据分析的框架和计算工具来帮助我们决策和判断。这时候R语言编程就会派上用场。例如从大的方面来看,投资方要决定在何处建立风力发电场,就需要采集天气数据加以建模分析转载 2016-06-08 00:24:01 · 1940 阅读 · 0 评论 -
R语言-文本分析
library(Rwordseg) #载入分词包library(tm) #载入文本挖掘包#第一部分:分词#把要分析的文件,存为文本文件(txt后缀),放到某个目录#1、装载自定义词库(这里的自定义词库,是根据分析文件中的某些特殊用词,自己编写的一个词库文件,其实也是一个文本文件,每行一个词。为什么要装自定义词库勒,是为了准确进行分词。某些单词如果不设置为自定义词,那么分转载 2016-05-14 15:48:14 · 15113 阅读 · 6 评论 -
R语言-正则表达式
在R语言中使用正则表达式替换,可以使用sub()函数,用于全局替换则用gsub()函数。1、例子假设有一个字符串向量,需要将多字节文本过滤出来:>a如果直接对其使用大小写转换函数toupper(),则会报错:> toupper(a)Error in toupper(a) : 多字节字符串1有错如何将该多字节字符去掉呢?假定它是读数据文件引入,没有意义的。2、过滤转载 2016-05-19 23:35:33 · 1625 阅读 · 0 评论 -
R语言-数据框dataframe的使用
1、数据框是R语言里中的一种数据结构,其内部可以由多种数据类型,每一列是一个变量,每行是一个观测记录。在R中数据框是很通用的数据结构,它是一种特殊的列表对象2、初始化数据框> mydataframe=data.frame(+ name=c(\"张三\", \"李四\", \"王五\", \"赵六\", \"丁一\"),+ sex=c(\"F\", \"F\"转载 2016-05-18 23:28:30 · 31120 阅读 · 1 评论 -
R语言-ggplot qplot作图
转载地址:https://www.douban.com/note/210758237/qplot()函数的详细用法:library(ggplot2)# 测试数据集,ggplot2内置的钻石数据qplot(carat, price, data = diamonds)dsmall #1. 按color,size,shape的基本分类可视化转载 2016-07-24 23:18:51 · 5241 阅读 · 1 评论 -
R语言-变量的基本操作
1.变量变换 as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...转换变量类型;使用如下命令可得到全部列表,methods(as) factor():将一个向量转化为一个因子2.变量信息 is.na(x),is转载 2016-05-17 22:30:31 · 13607 阅读 · 0 评论 -
R语言-因子和有序因子
因子(factor)和有序因子(ordered factor)因子用来存储类别变量(categorical variables)和有序变量,这类变量不能用来计算而只能用来分类或者计数。因子表示分类变量,有序因子表示有序变量。生成因子数据对象的函数是factor(),语法是factor(data, levels, labels, ...),其中data是数据,levels是因子水平向量,转载 2016-06-18 12:50:38 · 1314 阅读 · 0 评论 -
R语言-数据处理包 dplyr
一、安装install.packages("dplyr")二、案例分析与应用1. 数据准备library(Lahman): Lahman 包里的棒球比赛数据集 Battinglibrary(hflights): hflights 包里的飞机航班数据0.3 数据集类型将过长过大的数据集转换为显示更友好的 tbl_df 类型:hflights_df 2.转载 2016-06-18 12:47:41 · 1092 阅读 · 0 评论 -
R语言--在R语言中进行集合运算
来源:http://blog.sina.com.cn/s/blog_6caea8bf010159dt.html在实际工作中,我们经常需要进行一些集合运算,在R中怎么实现呢?当然用不着写for或者while循环那么复杂了,R已经为我们提供了非常强大的集合运算系列函数,下面就简单的介绍一下这些函数(假设A,B,C为三个集合):#首先对集合A,B,C赋值> A> B转载 2017-02-23 23:26:22 · 2749 阅读 · 0 评论