
r语言
TJ统计
这个作者很懒,什么都没留下…
展开
-
r语言画频数分布直方图和频率分布直方图
#画频率分布直方图#纵坐标名字为frequency,频数直方图。则使用:hist(x,freq=T)#纵坐标名字为density,频率直方图。则使用:hist(x,freq=F)hist(audit1[,1],col='white',freq=T)原创 2017-02-27 18:36:37 · 74470 阅读 · 0 评论 -
r语言预测值和真实值如何做table展示
#分类表,logistic回归分析时fitt.piypred0.5) #1*逻辑变量就变成了0和1变量ypredlength(ypred)nnPercantagePercantagerbind(Category,Percantage)#预测的好坏,做分类树时predictScorerownames(predictScore) #看这个矩阵行的原创 2017-03-02 18:47:45 · 9052 阅读 · 0 评论 -
r语言怎么做ROC曲线
#ROC曲线TPR=rep(0,1000)FPR=rep(0,1000)for(i in 1:1000){ p0=i/1000; ypredp0) TPR[i]=sum(ypred*audit2$is_run)/sum(audit2$is_run) FPR[i]=sum(ypred*(1-audit2$is_run))/sum(1-audit2$is_原创 2017-03-03 18:28:54 · 6035 阅读 · 0 评论 -
r语言中怎么划分训练集和测试集
#做训练集和测试集set.seed(1)sublength(sub)data_traindata_testdim(data_train)#训练集行数和列数13542 23dim(data_test) #测试集的行数和列数6771 23table(data_train$是否转化) #看该列分布的table(data_test$是否转化)原创 2017-02-25 10:59:51 · 35626 阅读 · 6 评论 -
r语言做决策树代码实现
0.节点和结点的区别:节点为两线相交,不为终点;而结点为两线相交为终点,没有延伸;1.分支节点:它指向其他的节点,所以是度不为0的节点。 vs 叶子结点:度为0的结点2.度:结点拥有的子树数;就是说这个结点下面有几条分支3.树的深度:树有几层4.10折交叉验证:常用的测试算法准确性的方法。 将数据集分成10份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验 每次原创 2017-02-25 14:43:51 · 21114 阅读 · 3 评论 -
r语言做决策树模型(少废话版本)
#第1步:工作目录和数据集的准备setwd("C:/Users/IBM/Desktop/170222分类树建模/2.23建模")#设定当前的工作目录,重要!audit2str(audit2) #转成字符串类型的#第2步:做训练集和测试集set.seed(1)sublength(sub) #24443data_traindata_testdim(dat原创 2017-02-25 14:47:13 · 31887 阅读 · 9 评论 -
r语言怎么将数据标准化和中心化
#r语言中怎么做中心化和标准化。中心化和标准化意义一样,都是消除量纲的影响#中心化:数据-均值#标准化:(数据-均值)/标准差#数据中心化: scale(data,center=T,scale=F) #数据标准化: scale(data,center=T,scale=T) 或默认参数scale(data)scale方法中的两个参数center和scale原创 2017-02-27 13:53:55 · 68366 阅读 · 2 评论