R编程
文章平均质量分 68
wildwind0907
留学瑞典的一名机器学习硕士生,有疑问或者错误请不要犹豫的告诉我,谢谢各位大佬。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R语言可视化作图笔记(2)感知与可视化预处理
感知与可视化预处理不同的散点图(ggplot2)还是以ggplot2里的mpg为例,第一幅只设置x,y,color三个参数。由于displ是numeric类型的数据,所以第一幅图中的colorbar是渐变的(continuous)library(ggplot2)data0 <- mpgggplot(data0) + geom_point(aes(x=hwy, y=cty, co...原创 2018-11-04 05:41:21 · 1189 阅读 · 0 评论 -
R语言 分类决策树 classification tree
R语言决策树示例建模造树rm(list=ls())data(spam)data <- spamid <- sample(1:4601,2000)train <- data[id,]test <- data[-id,]library(tree)library(rpart)mdl=tree(type~., data=train, spli...原创 2019-02-01 06:56:33 · 7696 阅读 · 1 评论 -
R语言 正则化 regularization
R语言 正则化示例stepAICrm(list=ls())data <- swissdata[,1:5] <- scale(data[,1:5])mdl <- lm(Infant.Mortality~., data = data) # 原本一共6个变量require(MASS)mdl_AIC <- stepAIC(mdl, direction = '...原创 2019-02-01 06:00:15 · 3734 阅读 · 0 评论 -
R语言 多项式回归 polynomial regression
R语言 多项式回归示例rm(list=ls())data <- swissdata[,1:5] <- scale(data[,1:5])data1 <- datafor (i in 1:3) { mdl <- lm(Examination ~ poly(Education, degree=i), data = data) data1[,6+i] <...原创 2019-02-01 05:27:22 · 6636 阅读 · 5 评论 -
R语言 最优子集选择与K折交叉验证
## 最优子集选择best_subset_selection &lt;- function(X, Y, Nfolds){# 生成所有可能的组合 m &lt;- ncol(X) idx &lt;- 1:(2^m-1) t &lt;- vector() mat &lt;- sapply(idx, function(id){ t &lt;- rbind(t, as.inte...原创 2019-02-01 05:03:55 · 8812 阅读 · 0 评论 -
R语言K-近邻算法 k-nearest neighbors algorithm
R语言KNN算法代码示例# 数据处理rm(list=ls())require(kernlab)data(spam)data &lt;- spamn &lt;- nrow(spam)id &lt;- sample(1:n, floor(n*0.5))train &lt;- data[id,]test &lt;- data[-id,]require(kknn)# 由于data...原创 2019-02-01 04:51:02 · 1434 阅读 · 0 评论 -
R语言逻辑回归 logistic regression
R语言逻辑回归代码示例rm(list=ls())require(kernlab)data(spam)data &lt;- spamn &lt;- nrow(spam)id &lt;- sample(1:n, floor(n*0.5))train &lt;- data[id,]test &lt;- data[-id,]mdl &lt;- glm(formula = type~.,...原创 2019-02-01 04:42:33 · 5594 阅读 · 0 评论 -
R语言 逻辑回归模型与混淆矩阵相关知识
逻辑回归模型(Logistic Regression Model)建模逻辑回归模型是一种 基于线性回归模型 的分类模型,将回归(regression)模型数值化(numeric)的优势用在了分类(classification)上。借助glmnet包,以iris的前100位的两种花 setosa 和 versicolor 为例library(glmnet)## 数据处理data &amp;lt;...原创 2018-11-26 10:56:11 · 6959 阅读 · 1 评论 -
R语言可视化作图笔记(5)文本可视化
文本可视化(Text Visualization)词云(Word Cloud)本例中Five.txt是一个包含对CASIO某一手表的所有五星好评,分别用到了tm,wordcloud,RColorBrewer建立词云data&amp;lt;-read.table(&quot;Five.txt&quot;,header=F, sep='\n') #读取文档library(tm)library(wordcloud)li...原创 2018-11-06 06:08:35 · 1024 阅读 · 0 评论 -
R语言可视化作图笔记(5.1)交互式图形
交互式图形(Interactive Graphics)在可视化时,可交互的图比静态(static)的图更方便分析。了解不同的交互方式可以帮助我们理解交互的分析,了解可视化软件的局限以及改进。[交互算子(Interactive operator):例子]导览(Navigation):相机位置,观察方向,分级显示细节选择(Selection):高亮,掩盖连接(Connection)过滤(...原创 2018-11-08 10:28:52 · 3645 阅读 · 1 评论 -
R语言可视化作图笔记(6.1)动画
动画散点图数据Oilcoal包含了8个国家从1965年到2009年的煤炭与石油消耗量(百万吨),除了美国和中国的Marker.size为1,其他国家的为0.5head(Oilcoal)# Country Year Coal Oil Marker.size Oil_proportion#1 US 1965 291.8264 548.933 1...原创 2018-11-13 08:16:54 · 924 阅读 · 1 评论 -
R语言可视化作图笔记(4)多维数据可视化
多维数据可视化热力图(Heat map)热力图对数据的要求很多数据必须要统一范围横纵坐标皆须重新排序(利用seriation::seriate)数据预处理可以减小大区间的数据给小区间数据的影响,如同2D密度图和地图上一样。重新排序横纵坐标可以方便我们对观察量进行分组,查找奇异点等。以iris绘制热力图library(plotly)library(seriation)data...原创 2018-11-05 07:58:37 · 3888 阅读 · 1 评论 -
R语言可视化作图笔记(6)图形视觉化
图形视觉化(Graph Visualization)网络可视化(Network Visualization)以下是马德里三一一连环爆炸案参与者制作的关系网,数据来自两个重要变量,nodes包含了所有的序列(id),人名(label)和组别(group),edges包含了所有的连线的起始(from),终点(to),线粗(value)&amp;amp;gt; head(nodes) id group ...原创 2018-11-13 04:59:20 · 1376 阅读 · 1 评论 -
R语言可视化作图笔记(3.1)地理空间可视化2
地理空间可视化(Geospatial Visualization)rds 与 sf我们选择 GADM 提供的关于瑞典的数据作为示例。下载 R(sf) 中的 level1 的rds地图。( level 代表地图的精细程度)另一份是瑞典统计局 SCB 提供的瑞典各省不同年龄的居民收入的开源统计数据。【由于统计方式不同,有时需要对比character变量,用grep(pattern, X),会...原创 2018-11-05 01:20:38 · 1448 阅读 · 0 评论 -
R语言可视化作图笔记(3)地理空间可视化
地理空间可视化(Geospatial Visualization)aegypti_albopictus.csv是一个包含了全球各地历年受到Aedes aegypti与Aedes albopictus两种蚊子感染登革热患者的统计数据。COUNTRY和COUNTRY_ID为各地名称与缩写。plotly::plot_geo通过plotly自带的地图,我们可以直接很棒的地图。下图是用plot_geo...原创 2018-11-05 00:24:59 · 2759 阅读 · 3 评论 -
R语言可视化作图笔记(1)R语言ggplot2与plotly的基本介绍
以包自带的数据mpg为例library(ggplot2)data0 &amp;amp;amp;lt;- mpgggplot(data = data0,mapping = aes(x=displ))+ geom_density() # 密度图## 另一种形式# ggplot()+geom_density(data = data0,mapping = aes(x=displ))...原创 2018-11-03 00:46:15 · 5272 阅读 · 2 评论 -
R语言可视化作图笔记(2.1)MDS 的 Shepard plot
MDS 的 Shepard plot比较多维度数据分析(multidimensional scaling,MDS)的好坏可用Shepard plot【不知道怎么翻译】展示。作图后,折线越趋近于一条平滑的斜线表明MDS降维的效果越好。R代码:library(MASS)library(plotly)# 由于数据不好,只取iris的前15位,取多了会有距离位0的情况data &amp;lt;- sc...原创 2018-11-04 06:46:06 · 3050 阅读 · 1 评论 -
R语言 朴素贝叶斯分类器 naive Bayes classifier
朴素贝叶斯分类器示例rm(list=ls())data(spam)data &amp;lt;- spamid &amp;lt;- sample(1:4601,2000)train &amp;lt;- data[id,]test &amp;lt;- data[-id,]library(e1071)nb=naiveBayes(type~., data=train)pred &amp;lt;- predict(nb原创 2019-02-01 06:58:11 · 4789 阅读 · 0 评论
分享