
R
jmxing
这个作者很懒,什么都没留下…
展开
-
新文档
求两组数据同时上升和下降的比例 f<-function(x){ b=x[-1]-x[-length(x)] return(ifelse(b>0,1,-1))}f1<-function(x,y){ c=lapply(list(x,y),f) return(mean(c[[1]]==c[[2]]))}一个同等代码f2<-function(x,y) mean(sign(diff(翻译 2015-03-22 17:20:53 · 300 阅读 · 0 评论 -
求两点间最短距离
求两点间最短距离f1<-function(x){ lx<-length(x) i<-x[lx] j<-which.min(x[(i+1):(lx-1)]) k<-i+j return(c(k,x[k]))}f2<-function(y){ n<-nrow(y) yy<-cbind(y,1:n) y1<-apply(yy[-n,],1,f1) i<-which.翻译 2015-03-24 09:07:43 · 776 阅读 · 0 评论 -
案例代码
文本词汇索引f函数以及对索引结果进行排序f1f<-function(x){ txt<-scan(x,'') txt1<-list() for(i in 1:length(txt)){word<-txt[i]txt1[[word]]<-c(txt1[[word]],i) } return(txt1)}f1<-function(x){ txt2<-names(x) n翻译 2015-03-24 16:14:11 · 456 阅读 · 0 评论 -
统计软件第六次作业
R语言作图原创 2015-04-11 15:40:01 · 1745 阅读 · 0 评论 -
第七次作业
统计软件第七次作业处理缺失值(knn和相关性)第一题利用变量间的相关性借补时,由于会发生最相关的变量对应位置处的观测值也恰好缺失的情形,所以请将这样的情形也考虑在内,即考虑用能借补的那些变量中相关性最大的那个即可。代码library(DMwR)data(algae)head(algae)algae1<-algae[manyNAs(algae,0),]algae2<-algae[-manyNA原创 2015-04-19 18:14:41 · 448 阅读 · 0 评论 -
中文文本挖掘的贝叶斯分类器&SVM
贝叶斯分类器中文文本挖掘jiebaRSVM原创 2015-05-20 11:41:55 · 1457 阅读 · 2 评论 -
基于RCurl包的爬虫技术
library(RCurl)library(XML)myHttpheader <- c( "User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ", "Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",原创 2015-04-30 18:40:43 · 1013 阅读 · 0 评论 -
随机森林代码
library(randomForest)totaldata<-read.table("/export/tangjie/leak_change.txt",header = FALSE,sep = '\t')names(totaldata)<-c('pin','p_book','n_book','m_book','office','music','luxury','fitness','adult_转载 2015-09-22 17:44:41 · 1153 阅读 · 0 评论