【R笔记】R机器学习(五)——决策树ID3算法

本文介绍了一种使用R语言进行数据集划分的方法,并通过rpart库实现了决策树的构建与可视化。该方法首先定义了一个名为Fold的函数用于将数据集划分为多个折叠,然后读取CSV文件作为数据源,最后利用rpart库训练了决策树模型并绘制了决策树图。

数据集


代码

Fold = function(Z=10, w, D, seed=7777){
n = now(w)
d = 1:n; dd = list()
e = levels(x[,D])
T = length(e); set.seed(seed)
for(i in 1:T){
d0 = d[w[,D]==e[i]]; j = length(d0)
ZT = rep(1:Z. ceiling(j/Z)[1:j]
id = cbind(sample(ZT, length(ZT)), d0); dd[[I]]=id}
mm = list(); for(I in 1:Z){u=NULL;
for(j in 1:T) u = c(u, dd[[j]][dd[[j]][,1]==I,2])
mm[[I]]=u}
return(mm)}

w = read.csv('data.csv')
library(rpart.plot)
a = rpart(NSP~., w)
rpart.plot(a, type = 2, extra = 4)


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值