
R
文章平均质量分 82
_,_
这个作者很懒,什么都没留下…
展开
-
R语言各种核函数的支持向量机分类、回归与参数优化
多种核函数分类及参数优化分类数据集采用iris,先用ggplot画出其分布情况,这里用了花萼宽度和花瓣长度作为输入,标签是花的种类library(ggplot2)ggplot(iris,aes(x=Sepal.Width,y=Petal.Length,col=Species))+geom_point()可以看出其属于近似线性可分的情况,接下来用svm进行拟合,首先用默认的径向基核函数作为核函数进行模型拟合library(e1071)svm.fit<-svm(Spec.原创 2020-05-29 20:27:16 · 7535 阅读 · 1 评论 -
R语言马氏距离判别法
没啥好解释的,就放个代码和运行结果吧#数据准备x1<-c(3,3,2,3,3,3,3,3,2,2,1,3,2,1,2,2,2,3,3,2,2,2,2,2)x2<-c(28,45,55,55,50,70,75,80,50,35,40,50,35,50,40,45,25,40,50,70,70,45,25,25)x3<-c(2,2,3,3,2,3,3,3,3,1,2,2...原创 2020-04-07 16:30:37 · 7369 阅读 · 0 评论 -
R语言利用jiebaR和wordcloud2对有关钻石公主号的评论绘制词云
这里要对有关钻石公主号事件的评论做词云分析,通过用户自定义词典和停用词来对评论进行分词引入包library(wordcloud2)library(jiebaR)library(RColorBrewer)读入数据并分词。这里我们的数据是每一行为一个评论,一开始我用的read.table和read.csv来读入,以‘’为分隔符,但总出现某个换行以/n的形式出现在数据中,所以我们采用r...原创 2020-03-11 16:01:29 · 486 阅读 · 0 评论 -
R语言cowplot介绍——把不同的图像拼接到一起
在R中,想把plot绘制的图像拼接到一起通常可以用par(mfrow=c())来实现,但高级作图基本不会使用plot,而是选择ggplot2或者其他工具包,在ggplot中,想要拼接两个用ggplot绘制的图像是很难的,ggplot的图像合并大多要求使用同一个data.frame,否则就会报以下错误: Don't know how to add ggplot(data) to a plot...转载 2020-02-16 17:26:01 · 34263 阅读 · 3 评论 -
R语言ggplot2绘制二维数据密度图和等高线图
先载入数据和ggplot2d<-read.csv("passingevents.csv")library(ggplot2)先绘制一张等高线图,在这里也可以选择不添加散点,不需要的话去掉去掉geom_point()即可p <- ggplot(d, aes(x=EventOrigin_x, y=EventOrigin_y))p + geom_point(size=0.6...原创 2020-02-18 20:10:18 · 11536 阅读 · 3 评论 -
R语言之多重共线性的判别以及解决方法
多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。 1.可以计算X矩阵的秩qr(X)$rank,如果不是满秩的,说明其中有Xi可以用其他的X的线性组合表示;(完全的线性表示,此方法不能作为判别是否有共线性的标准,因为有可能存在共线性但不是完全线性相关)2.也可以计算条件数kapp转载 2017-11-07 17:53:05 · 38637 阅读 · 0 评论 -
R语言svm支持向量机多元回归预测
数据用的还是之前的股票数据library(e1071)xx[,1] #将第一列的时间数据换成1:length的向量#建立模型m #预测p#取实际值r#计算相对误差sfor(i in 1:95){if(abs(p[i]-r[i])s}s#输出结果s为86,说明90%以上的预测结果与实际值的误差都在0.15之内,取原创 2017-08-15 19:42:34 · 18715 阅读 · 0 评论 -
R语言主成分分析
head(swiss)#查看数据cor(swiss)#查看相关性矩阵方阵中绝对值最小的是0.06085861,比0.05大,因此swiss中变量相互之间均有或强或弱的相关关系,这份数据适合做主成份分析。由于变量的量纲不同会使主成份得分系数的可解释性变差,使结果受到量纲大的变量影响,而忽略量纲较小的变量,所以对数据进行标准化,使每个变量都服从均值为0,方差为1的正态分布s原创 2017-08-25 16:15:32 · 6248 阅读 · 0 评论 -
R语言svm支持向量机分类与参数优化
首先构建数据集xyzdata画出数据集的情况plot(x,y,col=c(rep('red',50),rep('blue',100),rep('red',50)))构建支持向量机library(e1071)svm.fitsummary(svm.fit)########Call:svm(formula = z ~ x + y, data原创 2017-08-20 14:25:04 · 34488 阅读 · 8 评论 -
R语言KNN聚类
R语言KNN聚类训练集library(class)sam<-sample(c(1:150),100)iris[6]<-c(rep(0,50),rep(1,50),rep(2,50))iris.sam<-iris[sam,]iris.test<-iris[-sam,]plot(iris.sam[1:2],col=iris.sam$Species)knn.cv(iris.sam[,1:2],原创 2017-08-19 20:07:23 · 1640 阅读 · 0 评论 -
R语言col参数值对应的颜色条形图
原文链接:http://blog.youkuaiyun.com/zhouyijun888/article/details/69213494绘制图形时,我们经常会给图形设定相应的颜色,通过保留下面的关于颜色的条形图,我们就可以很轻松的知道相应的col参数值所对应得具体颜色pdf("colors-bar.pdf",heigh=120)par(mar=c(0,10,3,0)+0.1,yaxs转载 2017-12-09 15:18:10 · 13687 阅读 · 1 评论 -
线性回归诊断--R
原文链接:https://www.cnblogs.com/runner-ljt/p/4581622.html 在R中线性回归,一般使用lm函数就可以得到线性回归模型,但是得到的模型到底合不合适?在我们使用所得到的线性模型之前就需要进行回归诊断。 线性回归的诊断,主要是检验线性回归模型的假设是否成立。 线性回归模型 y=Θ0+Θ1x1+Θ2x2+...转载 2017-11-26 17:43:27 · 5641 阅读 · 0 评论 -
R语言批量读入数据文件到一个数据集
原文地址:http://blog.163.com/ruby_geh/blog/static/260528078201611238410176/在流水化办公中,通常有格式统一的表格文件产生,但是到最后要将这一堆表格文件整合为大表却很揪心,累断手,如何用R语言进行一次性导入整合呢?假设我们将D:/input文件夹作为需要导入的表格的存放点,文件夹内所有文件均为此次需要导入数据,那么转载 2018-01-17 14:45:09 · 10656 阅读 · 1 评论 -
R语言ggpubr包绘制带检验p值的箱线图
my_comparisons #建立要进行独立性检验的变量listggboxplot(d4, x="样品", y="染色体外环形DNA长度", color = "样品", palette = c("#00AFBB", "#E7B800", "#FC4E07"), add = "jitter", shape="样品",yl原创 2018-01-20 22:27:56 · 13824 阅读 · 0 评论 -
统计建模与R软件-第五章 假设检验
来源: http://www.cnblogs.com/digging4/p/5054603.html 作者:digging45.1正常男子血小板计数均值为225∗109/L225∗109/L,今测得20名男性油漆工人的血小板计数值(单位:109/L109/L):220,188 ,162 ,230 ,145 ,160 ,238 ,188 ,247 ,113,126 ,245 ,164 ,23...转载 2018-05-02 10:41:12 · 11472 阅读 · 0 评论 -
R语言knn算法的两种方法:class包与kknn包
k近邻算法工作原理如下:1、首先指定“训练”数据集2、对于一个新的即将被预测分类的观测值,算法试图找到距离这个新的观测值最近的K个观测值,并预测这个新的观测值的类别。3、新观测值的类别由与其最近的k个观测值类别占比最多的类别决定,作为该新值的类别。4、不像其它模型,k近邻并没有创建一个模型对象。而是,你需要提供训练数据以及测试数据作为参数。原文:https://blog.youkuaiyun.com...原创 2019-03-31 13:48:53 · 16777 阅读 · 0 评论 -
R语言正则表达式与字符串处理函数
原文链接:http://www.sohu.com/a/205441283_466874基础文本处理函数中正则表达式的应用R中常用的支持正则表达式的基础文本处理函数包括grep/grepl、sub/gsub、regexpr/gregexpr等。example_text1 <- c("23333#RRR#PP","35555#CCCC","louwill#2017")#以#进行字...转载 2019-05-04 22:00:53 · 605 阅读 · 0 评论 -
如何开发自己的R包
首先,先定义好自己的函数,保存为R文件放到某一目录下后,执行下面的代码:package.skeleton(name="package_name",code_files=code)code是你的代码文件目录然后在你的R工作目录下会生成一个‘package_name’的文件夹,打开这个文件夹里面有5个文件,man,R,description,namespace,readmedeletem...原创 2019-05-22 21:32:08 · 1285 阅读 · 0 评论 -
R语言h2o深度学习回归预测
配置所需环境:install.packages("h2o")library(h2o)Sys.setenv(JAVA_HOME="E:/java/JAVA(1)") -----配置环境变量h2o.init() #链接h2o平台使用的数据形式如下:先处理一下数据,划分一下数据集:agutraingutestwrite.table(gutr原创 2017-07-27 16:31:43 · 2491 阅读 · 7 评论 -
R语言h2o深度学习分类
配置所需环境:install.packages("h2o")library(h2o)Sys.setenv(JAVA_HOME="E:/java/JAVA(1)") -----配置环境变量h2o.init() #链接h2o平台下载数据:训练集: http://www.pjreddie.com/media/files/mnist_train.csv测试集:原创 2017-07-27 16:22:33 · 2104 阅读 · 0 评论 -
R语言plot作图参数
原文链接:http://www.mamicode.com/info-detail-404593.html函数名称:plot用 途:作图用 法:plot(x, y, ……)参 数:1、符号和线条 pch:指定绘制点所使用的符号,取值范围[0, 24],其中4是“差号”,20是“点” cex:指定符转载 2017-08-11 17:39:01 · 12401 阅读 · 1 评论 -
R语言ggplot2饼状图
dtdt = dt[order(dt$A, decreasing = TRUE),] ##把数据集根据A列进行排序,从大到小myLabel = as.vector(dt$B) ##转成因子型,防止图例标签顺序与实际顺序不符myLabel = paste(myLabel, "(",dt$A,' ', rou原创 2017-04-06 00:16:20 · 11344 阅读 · 0 评论 -
ggplot2图例编辑
ggplot2中图例基础:ggplot2会自动生成图例,我们可以对图例进行删改。相同名称相同颜色的图例会自动合并。如下图,点图和线图的color、shape产生的图例都是相同名称相同颜色的,所以合并在一次:library(ggplot2)dt = data.frame(A = 1:10, B = c(2,21,6,18,9,25,13,15,10,3), C = c('A','C',转载 2017-04-08 10:19:29 · 7353 阅读 · 0 评论 -
R语言 时间序列分析之ARIMA模型预测
原文地址:R语言学习日记——时间序列分析之ARIMA模型预测作者:KevinARIMA预测时间序列:指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间,那么预测误差必须是不相关的, 而且必须是服从零均值、 方差不变的正态分布。即使指数平滑法对时间序列连续数值之间相关性没有要求,在某种情况下,我们可转载 2017-04-08 18:49:51 · 5046 阅读 · 1 评论 -
R语言手动设置xy轴刻度
在R中,plot函数作图时会自动给出xy轴的刻度标度,如下图:有时我们需要自己定义xy轴的刻度,这时我们可以用axis中的at和labels参数来更改。首先,我们先令plot不要画出xy轴的标度然后,用axis函数设置xy轴的刻度这样xy轴的刻度就完全按照我们自己的意愿显示了,也可以设置at参数不是均匀的,总之,用这两个参数就可以完全自己控制xy轴的刻度显示原创 2017-04-30 15:05:28 · 46110 阅读 · 3 评论 -
R语言针对txt文本的词云做法
library(rJava)library(Rwordseg)library("RColorBrewer")library("wordcloud")myfilemyfile.resmyfile.wordsmyfile.wordsmyfile.wordsmyfile.wordsmyfile.words1)myfile.freqmyfile.freq原创 2017-04-16 12:54:26 · 2430 阅读 · 0 评论 -
R语言绘图004-legend()参数详解
原文链接:http://blog.sina.com.cn/s/blog_5de124240101pzqb.htmllegend(x, y = NULL, legend, fill = NULL, col = par("col"), border = "black", lty, lwd, pch, angle = 45, densi转载 2017-04-21 16:05:06 · 8972 阅读 · 0 评论 -
R语言设置java环境变量
前些日子在R中调用h2o包,在执行h2o.init()链接h2o平台时,提示java有问题,大约说是版本不合,让我去下载最新版本,后来下了也没用,还是提示相同的错误,试了好几次还是不行,最后请教大佬才知道是环境变量的问题,只需要执行下面一行代码即可Sys.setenv(JAVA_HOME="E:/java/JAVA(1)")其中引号中是你的java安装路径,运行之后再h2o.init(原创 2017-05-06 22:59:57 · 4784 阅读 · 1 评论 -
R语言绘制股票K线图
首先解释一下K线图的含义:首先我们找到该日或某一周期的最高和最低价,垂直地连成一条直线;然后再找出当日或某一周期的开市和收市价,把这二个价位连接成一条狭长的长方柱体。假如当日或某一周期的收市价较开市价为高(即低开高收),我们便以红色来表示,或是在柱体上留白,这种柱体就称之为“阳线”。如果当日或某一周期的收市价较开市价为低(即高开低收),我们则以绿色表示,又或是在柱上涂黑色,这柱体就是“阴线”了。原创 2017-06-07 21:25:48 · 8303 阅读 · 0 评论 -
R语言分图散点图
Sys.setenv(JAVA_HOME="E:/java/JAVA(1)") #由于文件是xlsx格式,读取过程需要用到rjava包,所以需要配置java环境library(rJava)library(xlsx)library(ggplot2)x数据形式如下:ggplot(x, aes(x=time,y=SUM,group=1))+geom_point()+fa原创 2017-06-07 23:56:27 · 3891 阅读 · 0 评论 -
R语言抓字符删重match
x7xx79,1] xx7如下:> xx7 [1] 04:41 04:56 05:11 05:26 05:41 05:56 06:11 06:34 06:26 06:41 07:00 06:56[13] 07:23 07:12 07:32 07:27 07:42 07:57 08:24 08:11 08:26 08:41 09:02 08:57[25] 09:12 09:原创 2017-06-12 23:08:20 · 1030 阅读 · 0 评论 -
在Rstudio中更换绑定的R的版本
如下图,选择Tools里的Global Options选项,然后点Change,选择你的R版本,确认,重启Rstudio即可原创 2017-07-15 16:38:06 · 47153 阅读 · 0 评论 -
用R实现一个简单的感知机
1. 感知机模型定义:假设输入空间(特征空间)是χ⊆Rn,输出空间是Y={+1,−1}。输入x∈X 表示实例的特征向量,对应于输入空间的点;输出y∈Y 表示实例的类别。由输入空间到输出空间的如下函数 f(x)=sign(w⋅x+b)称为感知机。其中,w和b为感知机模型参数,w∈Rn叫做权值,b∈R 叫做偏置,w⋅x表示w和x的内积。sign为符号函数。原创 2017-07-16 20:54:01 · 1819 阅读 · 1 评论 -
R语言网页爬虫
library(rvest)url0 web News % html_nodes('div.news-item h2 a')#---获得新闻标题---Title %html_text()#---获得新闻时间---Time % html_nodes('div.time') %>% html_text()#---获得链接---link % html_attrs()原创 2017-07-17 10:41:28 · 646 阅读 · 0 评论 -
R语言mxnet做深度学习回归预测
下面的代码参考http://blog.youkuaiyun.com/xxzhangx/article/details/54729055来获取解释:library(mxnet)data(BostonHousing, package="mlbench")str(BostonHousing)dim(BostonHousing)train.ind = seq(1, 506, 3)train原创 2017-07-20 16:47:51 · 2179 阅读 · 0 评论 -
R语言深度学习mxnet做分类
首先安装mxnet的包:cran <- getOption("repos")cran["dmlc"] <- "https://s3-us-west-2.amazonaws.com/apache-mxnet/R/CRAN/"options(repos = cran)install.packages("mxnet") 完成之后我的R提示我要我重新下载"mlbench"包,我也不知道为原创 2017-07-19 15:25:34 · 2256 阅读 · 0 评论 -
R语言ggplot2x轴顺序设置自定义颜色
先声明一下所用的数据集第一个图如下这个图主要在于x轴的顺序设置上,如果按不做任何处理的话>3那个就会在2之前,解决方法是b[,1]3")),这句代码可以重新设置因子的级别完整代码如下:a[,1]3"))ggplot(a,aes(x=a[,1],y=a[,2]))+geom_bar(stat="identity")+xlab('转录本数目')+ylab('主导转录原创 2017-07-24 17:00:21 · 14553 阅读 · 0 评论 -
R语言绘制双坐标图直方图与折线的结合
par(mar = c(5, 5, 3, 4)+0.1)#似乎是设置图片位置barcol="blue",col.axis="blue",col.lab="blue")mtext(c(1:22),side=1,line=1,at=bar,cex=0.8,col="black")mtext("time",side =1,line=3,col="black")par(new=原创 2017-08-17 14:49:31 · 12085 阅读 · 1 评论 -
用plotrix包做双坐标轴图
library(plotrix)xy1y2df如图:xpostwoord.plot(xpos,y1,xpos,y2,lcol=4,rcol=2,rylim=c(40000,500000), xlab="time",ylab="开盘价",rylab="交易额",type=c("b","bar"),xticklab=x,halfwidth=0.2)原创 2017-04-07 18:51:04 · 3088 阅读 · 0 评论