
R语言
茁壮小草
这个作者很懒,什么都没留下…
展开
-
待完善 | R语言 | 优化函数 | optimize,optimise,optim
R语言中,常用的优化函数知多少,这次将介绍optimize,optimise,optim这三个做优化的函数,也是目前最常用到的优化函数。做一元的优化:只有要给参数 optimize,optimise,此外,optim也可以做一元优化。前面两个较为常用些。这两个函数的用法是相同的,先给定函数,指定参数的取值函数,再从取值范围中优化,对于凸函数,能够取到全局最优解,对于非凸函数,可能取到局部最优解。原创 2017-07-08 20:44:05 · 26232 阅读 · 5 评论 -
R语言:PPS抽样
今天有朋友咨询我怎么写PPS抽样的代码,试着找了下,找到一个实现PPS抽样的R包。百度百科: PPS 抽样是指按概率比例抽样,属于概率抽样中的一种。是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中原创 2016-12-15 22:52:07 · 10700 阅读 · 0 评论 -
重叠区间的个数
题目:给定多个可能的重叠的区间,找出重叠区间的个数。伪代码:区间的定义如下:class Interval{ int start; //起点 int end; //止点 Interval (int a,int b){ start =a; end = b; }}首先,要定义区间的类,实现Comparable接口,含有起点与止点的值和类型,还要重写用于排序的compa原创 2016-12-09 22:11:20 · 3121 阅读 · 0 评论 -
R语言:lengths计算列表list中元素的个数
这次介绍一个大家可能会用到的函数,但是又与我们常用的函数有所区别。lengths一看,还以为是length函数,我们要介绍的函数后面多了一个s,专门用于计算列表list的长度,下面用例子来呈现我们的函数。首先,我们先来介绍length函数,再来介绍lengths,最后对两个差异的地方进行对比,查看区别。length Get or set the length of vectors (includ原创 2016-12-09 21:19:17 · 74311 阅读 · 0 评论 -
最大下标距离
题目 : 给定一个整型数组,找出最大的下标距离j−1j-1,当且仅当A[i]<A[j]A[i]<A[j]和i<ji<j。伪代码int maxIndexDistance(int A[]){ if (A==null || A.length<2) return 0; boolean inDescSeq[] = new boolean[A.length]; int min = A[0],n=A原创 2016-12-07 14:47:15 · 788 阅读 · 1 评论 -
两数之和 (一)
题目: 给定一个整型数组,是否能找出其中的两个数使其和为某个指定的值?伪代码:boolean hasSum(int[] A, int target){ boolean res = false; if(A ==null || A.length<2) return res; Arrays.sort(A); int i =0,j=A.length-1; wh原创 2016-12-01 12:55:36 · 1539 阅读 · 0 评论 -
两数之和(三)
题目:设计一个类,包含如下两个成员函数: Save(int input) 插入一个整数到一个整数集合里。 Test(int target) 检验是否存在两个数和为输入值。如果存在这两个数,则返回true;否则返回false。注意:允许有相同的元素。伪代码:这里写代码片R语言:two_numbers_3<-function(a){ s= unique(a) for原创 2016-12-02 12:48:14 · 580 阅读 · 0 评论 -
两数之和(二)
题目:给定一个整型的数组,找出其中的两个数使其和为某个指定的值,并返回这两个数的下标(数组下标是从0开始)。假设数组元素的值各不相同,则要求时间复杂度为O(n),n为数组的长度。伪代码:这里写代码片R语言:> res <- list()> index <- list()> k =0> i = 1> two_sum_2<-function(a,target){ if (is.null(原创 2016-12-02 00:15:51 · 712 阅读 · 0 评论 -
数组旋转
题目:返回将一维数组向右旋转k个位置的结果。比如,一维数组{1,2,3,4,5},当k=2时,返回结果是{4,5,1,2,3}。要求常数级空间复杂度,允许修改原有数组。伪代码这里写代码片R语言R语言实现这个功能上,采用两种方式:R语言自带的rev函数自己写的翻转函数R语言带的rev函数rotateK <- function(a,k){ if (is.null(a) || length(原创 2016-12-05 13:17:46 · 1765 阅读 · 0 评论 -
R语言:Sys.sleep()与Sys.time()
R语言实现获取当前的时间以及让语言计算停顿下,这次介绍三个函数:Sys.sleep()Sys.time()proc.time()Sys.sleep() 让R语言在做计算时停顿下,减缓运行速度#睡眠2秒Sys.sleep(2)Sys.time() 获取当前的系统时间,达到秒的精度。> Sys.time()[1] "2016-12-14 23:52:10 CST"proc.time()原创 2016-12-15 00:10:45 · 18512 阅读 · 0 评论 -
R语言:快速读取txt文件
用R语言来读取600多M的txt文件,使用常用的read.table,太费时间。想起之前用readr包来读取csv、spss的、sas、excel的很快,便尝试了翻。直接上代码:> library(readr)> a1=Sys.time()> BRCA_RNAseqGene<-read_delim("20151101-BRCA-RNAseqGene.txt", "\t", escape_dou原创 2016-12-16 18:13:09 · 23863 阅读 · 0 评论 -
R语言:用微软的深度学习理解图片情感
本文系转载,原博客:http://blog.youkuaiyun.com/wzgl__wh/article/details/52904069使用微软(https://www.microsoft.com/cognitive-services/en-US/subscriptions)的Emotion 来理解一张图片的人物表情,下面直接上代码:> library("httr")#链接API> library("X转载 2017-01-03 12:27:40 · 884 阅读 · 0 评论 -
R语言:用微软的深度学习得到人脸的特征数据
本文系转载,原地址:http://blog.youkuaiyun.com/wzgl__wh/article/details/52904069微软的深度学习https://www.microsoft.com/cognitive-services/en-US/subscriptions,使用Face功能来检测人脸的特征。下面用R语言来跑下案例:> img.url = 'https://www.whitehouse转载 2017-01-03 12:35:34 · 2350 阅读 · 1 评论 -
Rstudio | Word | 用Rstudio来书写公式到word中
在word中输入公式,你会采用哪种方式呢?word自带的公式编辑器 用mathtype来输入公式也许绝大部分人采用以上的两种,第一种的公式是可编辑的,第二种是不开编辑的,即公式离开了mathtype进入word中就变为不可编辑的形式。若是想要公式可编辑,还是选择使用word自带的公式编辑器吧。真的没办法提高公式编辑的效果、效率吗?Rstudio会帮我们搞定,轻松简单。我们会用到Rstudio的原创 2017-06-13 00:11:49 · 5537 阅读 · 0 评论 -
统计 | 统计功效 | R语言
在假设检验中,为了保证将真的判为假的概率很低,设置犯第一类错误的概率为α\alpha,通常情况下,α\alpha等于0.05或0.01。在现行的大学教科书中,根本没有提及将假的判为真的概率计算公式,下面来介绍如何计算统计功效,并介绍它的含义。这里http://blog.youkuaiyun.com/xxzhangx/article/details/72811527 介绍了p值的计算,我们就接着它来完善统计功效的原创 2017-06-12 23:28:16 · 7375 阅读 · 7 评论 -
R 语言 | 计算可达矩阵
在微博有位朋友问我可达矩阵的计算,于是发了点时间用R语言写出来了。问题如下: 计算过程: 注意:是矩阵的乘法。代码如下:A <- matrix(c(0,0,0,0,0,0,0,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,1,1,0),nrow=5)A1 <- A+diag(5)repeat{ B <- A1 * A1; if(identical(B,A1)) {pri原创 2017-04-30 18:05:14 · 4419 阅读 · 4 评论 -
R语言:计算各种距离
在做分类时常常需要估算不同样本之间的相似性(Similarity Measurement),这时通常采用的方法就是计算样本间”距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量做一个总结。本文目录:闵可夫斯基距离欧氏距离曼哈顿距离切比雪夫距离标准化欧式距离马氏距离夹角余弦汉明距离杰卡德距离&杰卡德相似系数相关系原创 2016-11-13 23:40:20 · 78309 阅读 · 10 评论 -
R:自己选择要读取的文件
这里以read.csv为你来说明函数file.choose() 在R的命令框中输入下面的函数,会弹出对话框,选择到你要的文件,然后点击确认,这样便将csv文件读入到了R中。 read.csv(file.choose())原创 2017-01-08 22:17:19 · 9572 阅读 · 0 评论 -
R:混淆矩阵
在机器学习中,最后要计算混淆矩阵,常用的函数有:tableconfusionMatrix下面以前馈神经网络为例来说明:> library("RSNNS") 载入需要的程辑包:Rcpp> library("reshape")> #example data and code from nnet function examples> ir<-rbind(iris3[,,1],iris3[,,原创 2017-01-08 22:10:53 · 10805 阅读 · 0 评论 -
R语言:翻转
这期介绍数组、字符串的翻转,元素间翻转,元素内翻转,采用rev、str_rev函数,并给出几个例子。rev元素间翻转> x <- c(1:5, 5:3)> x[1] 1 2 3 4 5 5 4 3> rev(x)[1] 3 4 5 5 4 3 2 1> x <- c("ABC", "DEF", "GHIJ")> rev(x)[1] "GHIJ" "DEF" "ABC" str_rev原创 2016-12-05 12:33:46 · 9262 阅读 · 0 评论 -
R语言:图形
常用的图形,这里给出案例:barplot条形图、单向量条形图> attach(mtcars)The following object is masked from package:ggplot2: mpg> names(mtcars) [1] "mpg" "cyl" "disp" "hp" "drat" "wt" [7] "qsec" "vs" "am"原创 2016-12-04 23:44:04 · 2079 阅读 · 0 评论 -
R语言:自定义函数
R语言系列:自定义function在用R语言做各种事物时,用户自定义函数是不可或缺的。这期来讲讲如何自定义R的function。首先要介绍的是function的基本框架:myfunction <- function(arg1, arg2, ... ){statementsreturn(object)}函数名称为myfunction arg1,arg2 为参数statements 为函数原创 2016-10-25 17:28:48 · 95143 阅读 · 3 评论 -
Cygwin安装镜像选择
用R语言的TCGA2STAT 包下载TCGA数据,在windows下发生错误。> library(TCGA2STAT)> #-- Default: Get only the omics-profiles, for example RNA-SeqV2> ACC.ov <- getTCGA(disease="ACC", data.type="RNASeq2")Error: TAR is not i原创 2016-10-11 10:08:24 · 3214 阅读 · 0 评论 -
T检验:两样本数据的差异性
我最近在研究TCGA的RNAseq数据表达差异性的分析,常用的并且最简单的方法是统计量T检验。下面用一个例子来验证T检验的弊端问题所在。两配对样本的T检验是利用来自两个总体的配对样本,推断总体的两个均值是否显著差异,从而推断两个总体是否存在差异。前提,我们是假定总体是服从正态分布的,X N(u1,σ21)X~N(u_{1},\sigma_{1}^{2}) 原假设:H0:u1−u2=0H_{0}:原创 2016-09-19 11:50:08 · 24859 阅读 · 2 评论 -
R语言基础概要
基于学习总结和网上收集!汇总供以后查看学习!运算符数学运算:+,-,*,/,^,%%。(加,减,乘,除,乘方,求余。)比较运算:>,<,>=,<=,==,!=。 (大于,小于,大于等于,小于等于,等于,不等于。)逻辑运算:&,|,!。(与,或,非。)初始基本操作获取工作目录。> getwd()设定工作目录setwd("")寻求帮助help(com)?com??con查看实例example(c原创 2016-09-16 20:36:26 · 982 阅读 · 0 评论 -
R语言包gdata读取excel文件
本次分享来源于自己学习时收集资料的总结EXCEL文件的格式有xls、xlsx这两种,这里我们采用R包是gdata的read.xls函数提示:read.xls函数对xls支持EXCEL97-2004版,对xlsx支持EXCEL2007+。现在我们常用的版本是2007以后的,对于文件为xls格式的,将格式改为xlsx即可。 xls格式的df = read.xls ("pharynx.xls",sh原创 2016-09-16 20:03:20 · 12328 阅读 · 0 评论 -
R语言:TCGA数据分析一
引言我最近在做TCGA数据分析,在处理中遇到的问题及其收获。主要包括:case ID 大小写处理数据的匹配涉及到的函数有:小写tolower大写toupper单一的局部匹配grep多个全局匹配match保留固定长度的字符substr大小写处理在RANseqGene中case ID 为大写的,而Clincial中为小写的。需要对case ID 做转换。方案一:大写变小写to原创 2016-08-13 12:44:09 · 9536 阅读 · 0 评论 -
R读取spss的sav格式数据
注: 这次分享是我在处理sav格式数据时总结,方法来源于网络。引言R读取spss数据中sav格式的数据,通常有两种情况:变量中只包含英文字符变量中包含有中文字符相对而言,处理英文的就很容易,方法也很容易查找到。下面是我对这两种情况的一个总结。英文字符方案一library(foreign) mydata=read.spss("data.sav") 方案二library(Hmisc) d原创 2016-08-13 11:37:54 · 25969 阅读 · 4 评论 -
R语言去重复数据
本次总结来源网络,有多处参考在R语言中,去掉重复数据的函数是:duplicated删掉所有列中数据一样的:>test <- data.frame( x1 = c(1,2,3,4,5,1,3,5), x2 = c("a","b","c","d","e","a","b","e"), x3 = c("a","b","c","d","e","a","c","e"))> test x1 x2原创 2016-08-30 14:46:25 · 43154 阅读 · 1 评论 -
R语言:数据类型
数据类型包括如下几种类型:ArrayData FrameFactorMatrixVectorComplexDate/TimeListOperatorsArray格式: array(data=NA,dim=length(data),dimnames=NULL)x<-array(1:9)x## [1] 1 2 3 4 5 6 7 8 9x<-array(1:9,c(3,6))原创 2016-07-23 19:02:09 · 1562 阅读 · 0 评论 -
R语言技巧:读取spss的sav格式文件
上几期介绍了R语言读取excel、csv格式,这期将介绍读取SPSS软件的数据。前面有一次介绍了2种读取方式,结合着学习下。前面几期:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件这期介绍haven包读取sav格式文件library(haven)dataset <- read_sav(NULL)View(datase原创 2016-11-07 15:20:03 · 27964 阅读 · 0 评论 -
R语言技巧:读取sas软件的sas格式文件
前面几期介绍了如下内容:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件这期介绍读取sas软件的sas格式文件,代码如下:library(haven)dataset <- read_sas(NULL)View(dataset)关于read_sas函数的具体用法,请参考其帮助文档。原创 2016-11-07 15:26:13 · 16135 阅读 · 2 评论 -
R语言技巧:对stata软件文档来读取
前面几期介绍了如下内容:读取excel文件 对比方法读取csv格式文件对比方法read.csv读取sav格式文件读取spss 的sav格式文件读取sas软件的sas格式的文件本期介绍读取stata软件的文件 下面来给出代码的格式:library(haven)dataset <- read_stata(NULL)View(dataset)关于对stata软件文件的读取,可以查看其帮助文原创 2016-11-07 15:32:51 · 6640 阅读 · 0 评论 -
R语言软件版本自动更新
这次介绍如何利用R语言命令自动更新你所使用的R语言软件的版本。 代码如下:install.packages("installr")library(installr)updateR()运行命令后,出现如下的提示: ok,保证网络畅通 下载完后会提示安装,安装目录,安装成功后,提示是否将old library复制到new library中。原创 2016-12-04 22:48:27 · 23251 阅读 · 3 评论 -
R与mongodb
本文系谷歌时发现,代码很好,注释全面,故先码过来,有需要的可以先学习。#http://cran.r-project.org/web/packages/rmongodb/vignettes/rmongodb_introduction.htmllibrary(rmongodb)# Connecting R to MongoDB ------------------------------------原创 2016-11-15 16:50:21 · 2831 阅读 · 1 评论 -
R语言技巧:对读取常用的集中格式的介绍
这期主要介绍几种常用格式的读取方法索引,内容如下:读取csv格式read_csvread.csv读取excel文件read_excel-用gdata读取excel文件读取spss 软件的sav格式文件read_sav两个方式读取sav格式文件读取sas软件的sas格式文件read_sas读取stata软件的stata格式文件read_stata原创 2016-11-07 16:57:35 · 788 阅读 · 1 评论 -
R语言:读取excel的perl问题
刚给朋友实验读取excel文件出错了,我的电脑却没有问题。报的错误是:Error in findPerl(verbose = verbose) : perl executable not found. Use perl= argument to specify the correct path. Error in file.exists(tfn) : invalid 'file' argumentb原创 2016-11-01 20:22:37 · 6105 阅读 · 1 评论 -
R语言:读取中文数据乱码的解决方案
R语言不是中国人开发的,自然对中文的处理上没有特别考虑,但是我们依然可以处理。一个例子,R语言读取excel表的中文数据,关于excel表的读取请看博客R语言包gdata读取excel文件。setwd("..")#设置工作目录getwd()#查看工作目录> a<-read.xls("watermelon.xlsx",sheet=1,header =T)> a 缂栧彿 鑹叉辰 鏍硅拏 鏁插原创 2016-11-01 18:26:27 · 40855 阅读 · 5 评论 -
R语言:小数点位数的设置
R语言中对小数点的位数的设置经常用数据分析,有时不同的文件的小数位数不一样,但是我们可以让它们的位数保持一致的,下面的介绍就是设置小数位数。使用options函数> options(digits) 默认为7位> a=0.234333323#9位> a[1] 0.2343333下面开始设置下> options(digits=3)> a=0.34434434#8位> a[1] 0.344原创 2016-10-30 22:29:15 · 68277 阅读 · 2 评论 -
R语言技巧:读csv格式的文件
最近Rsudio更新https://www.rstudio.com/products/rstudio/download/了,对我们常用的几种文件格式都作用了封装,直接点击按钮就可以对文件读取啦,感觉好强大好神奇的说。下面来一个个的给出代码!library(readr)dataset <- read_csv(NULL)View(dataset)当然,你也许会问,已经有了read.csv函数,为啥还原创 2016-11-07 14:59:59 · 18068 阅读 · 0 评论